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Konstruktion von Produktionsstammen fur die Herstellung von substituierten 
Phenolen durch gezielte Inaktivierungen von Genen des Eugenoi- und Ferula- 
saure-Katabolismus 

5 

Die vorliegende Erfindung betrifft die Konstruktion von Produktionsstammen und 
ein Verfahren fiir die Herstellung substituierter Methoxyphenole, insbesondere 
Vanillin. ____ 

flj^^^lO Die DE-A 4 227 076 (Verfahren zur Herstellung substituierter Methoxyphenole und 
^^^V daftir geeigneter Mikroorganismus) beschreibt die Herstellung substituierter 

Methoxyphenole mit einer neuen Pseudomonas sp.. Ausgangsmaterial ist hier Euge- 
nol und die Produkte sind Ferulasaure, Vanillinsaure, Coniferylalkohol und Coni- 
ferylaldehyd. 

15 

Ebenfalls 1995 erscheint ein umfangreiches Review uber die Biotransformations- 
moglichkeiten mit Ferulasaure von Rosazza et al. (Biocatalytic transformation of 
ferulic acid: an abundant aromatic natural product; J. Ind. Microbiol. 15:457-471). 




20 Die Gene und Enzyme zur Synthese von Coniferylalkohol, Coniferylaldehyd, 
Ferulasaure, Vanillin und Vanillinsaure aus Pseudomonas sp. wurden in EP-A 
0 845 532 beschrieben. 



Die Enzyme zur Umsetzung von /ram-Ferulasaure zu rra^75'-Feruloyl-SCoA Ester 

lir»H \X7*»it*at- li »-t c*/~x^^Aa. Anr^ -ft;- Al^ O-. — 1* J T7_^ ^J-i. I- 

Yfwxi.%^i. ^MXAx If C41XALXXAI., \aci:> vj*^n lui kxi^ Ojjaiiuil^ UC^ o:>LClS WUrucn Vum 

Institute of Food Research, Norwich, GB, in WO 97/35999 beschrieben. 1998 
erscheint der Inhalt des Patents auch als wissenschaftliche Publikationen (Gasson et 
al. 1998. Metabolism of ferulic acid to vanillin. J. Biol. Chem. 273:4163-4170; 

Narbad an d Gasson 1998. Meta bolism of feruli c acid via vaniUin using a novel CoA- 

0 dependent pathway in a newly isolated strain of Pseudomonas fluorescens. Micro- 
biology 144:1397 - 1405). 
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Die DE-A 195 32 317 beschreibt die fermentative Gewiiuiung von Vanillin aus 
Ferulasaure mit Amycolatopsis sp. in hohen Ausbeuten. 

5 Die bekannten Verfahren haben den Nachteil, dali entv^eder nur sehr geringe Aus- 
beuten an Vanillin erzielt werden, oder von relativ teuren Edukten ausgegangen wird. 
Bei dem letztgenannten Verfahren (DE-A 195 32 317) werden zwar hohe Ausbeuten 
erzielt. jedoch bedingt der Einsatz von Pseudnmnnas s p, HR199 u n d Amycolatopsis 
sp. HR167 fur die Biotransformation von Eugenol zu Vanillin eine zweistufige 
10 Fermentationsfuhrung und somit einen erheblichen Kosten- und Zeitaufwand. 

Aufgabe der vorliegenden Erfmdung ist es daher, Organismen zu konstruieren, die in 
der Lage sind den preiswerten Rohstoff Eugenol in einem einstufigen ProzeB zu 
Vanillin umzusetzen. 
15 

Diese Aufgabe wird durch die Konstruktion von Produktionsstammen ein- oder 
mehrzelliger Organismen gelost, die dadurch gekennzeichnet sind, dafi Enzyme des 
Eugenol- und/oder Ferulasaure-Katabolismus derart inaktiviert sind, daB eine Akku- 
mulation der Intermediate Coniferylalkohol, Coniferylaldehyd, Ferulasaure, Vanillin 
20 und/oder Vanillinsaure erfolgt. 

Der Produktionsstamm kann einzellig oder mehrzellig sein. DemgemaB konnen 
Gegenstand der Erfmdung Mikroorganismen, Pflanzen oder Tiere sein. Dariiber 
hinaus konnen auch Extrakte die aus dem Produktionsstamm gewonnen werden zum 

25 Einsatz kommen. ErfmdungsgemaB werden vorzugsweise einzellige Organismen 
eingesetzt. Hierbei kann es sich am Mikroorganismen, tierische oder pflanzliche 
Zellen handeln. Besonders bevorzugt ist erfmdungsgemaB der Einsatz von Pilzen und 
Bakterien, Hochst bevorzugt sind Bakterienarten. Unter den Bakterien konnen insbe- 
sondcvc^odocpccus-, Pseudomonqs- und Escherichia- Axicn nach Veranderung des 

30 Eugenol- und/oder Ferulasaure-Katabolismus zum Einsatz kommen. 
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Die Gewinnung der erfindungsgemaB einsetzbaren Organismen kann im einfachsten 
Fall mittels bekaiinter, konventioneller mikrobiologischer Methoden erfolgen. So 
kann die Enzymaktivitat der am Eugenol- und/oder Ferulasaure-Katabolismus betei- 
ligten Proteine durch den Einsatz von Enzym-Hemmstoffen verandert warden. 
Dariiber hinaus kann die Enzymaktivitat der am Eugenol- und/oder Ferulasaure- 
Katabolismus beteiligten Proteine durch Mutation der fur diese Proteine kodierenden 
Gene verandert werden. Derartige Mutationen konnen nach klassischen Methoden 
ungerichtet erzeuRt werden , yyie heispielsweif^e dur ch TTV-Restrahhinp oder rmita- 
tionsauslosende Chemikalien. 

Ebenso sind gentechnische Methoden zur Gewinnung der erfindungsgemafien Orga- 
nismen geeignet, v^e Deletionen, Insertionen und/oder Nukleotid-Austausche. So 
konnen beispielsweise die Gene der Organismen mit Hilfe von anderen DNA-Ele- 
menten (Q-Elemente) inaktiviert werden. Ebenso konnen mittels geeigneter Vektoren 
Austausche der intakten Gene gegen veranderte und/oder inaktivierte Gen-Strukturen 
durchgefuhrt werden. Die zu inaktivierenden Gene und die fur die Inaktivierung ein- 
gesetzten DNA-Elemente konnen dabei durch klassische Klonierungstechniken oder 
durch Polymerase-Kettenreaktionen (PGR) gewonnen werden. 

In einer moglichen Ausgestaltung der Erfmdung kann beispielsweise der Eugenol- 
sowie der Ferulasaure-Katabolismus durch Q-Element-Insertion oder Einfuhren von 
Deletionen in entsprechende Gene verandert werden. Hierbei konnen die Funktionen 
der Gene, die fiir Dehydrogenasen, Synthetasen, Hydratasen-AIdolasen, Thiolasen 
Oder Demethylasen kodieren, mittels der oben genannten gentechnischen Methoden 
inaktiviert werden, so dalJ die Erzeugung der betreffenden Enzyme blockiert ist. Vor- 
zugsweise handelt es sich um die Gene, die fur Coniferylalkohol-Dehydrogenasen, 
Coniferylaldehyd-Dehydrogenasen, Ferulasaure-CoA-Synthetasen, Enoyl-CoA- 
Hydratasen-Aldolasen, beta-Ketothiolasen, Vanillin-Dehydrogenasen oder VanilUn- 
^saure-Demethylasen kodieren . Ganz beso nders bevorzAjgt^sinfL/ignpt die die, in der 
EP-A 0845532 angegebenen Aminosauresequenzen kodieren und/oder deren Allel- 
variationen kodierenden Nukleotidsequenzen. 
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Gegenstand der Erfindung sind demgemafi auch Gen-Strukturen zur Herstellung 
transformierter Organismen und Mutanten. 

5 Vorzugsweise werden Gen-Strukturen zdr Gewinnung der Organismen und Mutanten 
eingesetzt, bei denen die fur Dehydrogenasen, Synthetasen, Hydratasen-Aldolasen, 
Thiolasen oder Demethylasen kodierenden Nukleotidsequenzen inaktiviert sind. 
Besonders bevorzugt sind Gen-Strukturen, bei dene die fur Conifervlalkohol^ 
Dehydrogenasen, Coniferylaldehyd-Dehydrogenasen, Ferulasaure-CoA-Synthetasen, 
Enoyl-CoA-Hydratasen-Aldolasen, beta-Ketothiolasen, Vanillin-Dehydrogenasen 
Oder Vanillinsaure-Demethylasen kodierenden Nukleotidsequenzen inaktiviert sind. 
Ganz besonders bevorzugt sind Gen-Strukturen, die die in den Figuren la bis Ir 
angegebenen Strukturen mit den in den Figuren 2a bis 2r wiedergegebenen 
Nukleotidsequenzen und/oder deren Allelvariationen kodierenden Nukleotidsequen- 
zen aufweisen. Besonders bevorzugt sind hierbei Nukleotidsequenzen von 1 bis 18. 

Die Erfindung schlieBt auch die Teilsequenzen dieser Gen-Strukturen sowie funktio- 
nelle Aquivalente ein. Unter funktionellen Aquivalenten sind solche Derivate der 
DNA zu verstehen, bei denen einzelne Nukleobasen ausgetauscht worden sind 
(Wobbelaustausche), ohne die Funktion zu andem. Auch auf Proteinebene konnen 
Aminosauren ausgetauscht werden, ohne dalJ eine Veranderung der Funktion die 
Folge ist. 

Den Gen-Strukturen konnen ein oder mehrere DNA-Sequenzen vor- und/oder nach- 
25 geschaltet sein. Durch Klonierung der Gen-Strukturen sind Plasmide bzw. Vektoren 
erhaltlich, die zur Transformation und/oder Transfektion eines Organismus und/oder 
zur konjugativen Obertragung in einen Organismus geeignet sind. 

Gege nstand der Erfin dung sin d femer Plasm ide und/oder yektojen zur Herstellung 
30 der erfindungsgemaBen trans formierten Organismen und Mutanten. Diese enthalten 
demgemaB die beschriebenen Gen-Strukturen, Die vorliegende Erfindung betrifft 
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demgemaB auch Organismen, die die genannten Plasmide und/oder Vektoren ent- 
halten. 

Die Art der Plasmide und/oder Vektoren hangt von deren Einsatzzweck ab. Um z. B. 
5 die intakten Gene des Eugenol- und/oder Ferulasaure-Katabolismus in Pseudomona- 
den gegen die durch Omega-Elemente inaktivierten Gene austauschen zu konnen, 
benotigt man Vektoren, die einerseits in Pseudomonaden iibertragen werden konnen 
(konjugativ ubertragbare Plasmide), andererseits dort jedoch nichtrepliziert werden 
konnen und somit in Pseudomonaden instabil sind (sogenannte Suizid-Plasmide). 
^■i^^^O DNA-Abschnitte, die mit Hilfe eines solchen Plasmidsystems in Pseudomonaden 
^^^V ubertragen werden, konnen nur erhalten bleiben, wenn sie durch homologe Rekom- 

bination in das Genom der Bakterienzelle integriert werden. 

Die beschriebenen Gen-Strukturen, Vektoren und Plasmide konnen zur Herstellung 
15 verschiedener transformierter Organismen oder Mutanten verwendet werden. Mittels 
der gennanten Gen-Strukturen konnen intakte Nukleinsauresequenzen gegen veran- 
derte und/oder inaktivierte Gen-Strukturen ausgetauscht werden. In den durch Trans- 
formation Oder Transfektion oder Konjugation erhaltlichen Zellen erfolgt durch 
homologe Rekombination ein Austausch des intakten Gens gegen die veranderte 
20 und/oder inaktivierte Gen-Struktur, wodurch die resultierenden Zellen nur noch uber 
^■^^^ die veranderte und/oder inaktivierte Gen-Struktur im Genom verfugen. So konnen 

^^^^ erfmdungsgemaB vorzugsweise Gene derart verandert und/oder inaktiviert werden, 

dafi die betreffenden Organismen Coniferylalkohol, Coniferylaldehyd, Ferulasaure, 
Vanillin und/oder Vanillinsaure zu erzeugen vermogen. 

25 

ErfmdungsgemaB derart konstruierte Produktionsstamme sind beispielsweise 
Mutanten des Stammes Pseudomonas sp. HR199 (DSM 7063) der in der DE-A 4 227 
076 und der EP-A 0845532 genau beschrieben wurde, wobei sich unter anderem die 
entsp rechenden Genst ruk turen aus den Figuren la bis I r in Verbindu ng mit den Figu- 



30 



ren 2a bis 2r ergeben: 
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Pseudomonas sp. HR199ca/4/QKm, enthaltend das durch QKm inaktivierte 
calA'GQn an Stelle des intakten caM-Gens kodierend fur Coniferylalkohol- 
Dehydrogenase (Fig. la; Fig. 2a). 

Pseudomonas sp. \lK\99calAQGm^ enthaltend das dutch QGm inaktivierte 
calA-G^n an Stelle des intakten calA-G^ns kodierend fiir Coniferylalkohol- 
Dehydrogenase (Fig. lb; Fig, 2b). 

Pseudomonas sp. HR199caMA, enthaltend das durch Deletion inaktivierte 
calA'Gen an Stelle des intakten calA-Gcns kodierend filr Coniferylalkohol- 



15 
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6. 



9. 



10. 
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Dehydrogenase (Fig. Ic; Fig. 2c), 

Pseudomonas sp. HRl99calBCiKm, enthaltend das durch QKm inaktivierte 
calB-Gcn an Stelle des intakten calB-Gens kodierend fur Coniferylaldehyd- 
Dehydrogenase (Fig. Id; Fig. 2d) 

Pseudomonas sp. HR199ca/5QGm, enthaltend das durch QGm inaktivierte 
calB-Gen an Stelle des intakten ca/5-Gens kodierend fur Coniferylaldehyd- 
Dehydrogenase (Fig. le; Fig. 2e). 

Pseudomonas sp. HR199ca/5A, enthaltend das durch Deletion inaktivierte 
calB-GQn an Stelle des intakten calB-Gcns kodierend fiir Coniferylaldehyd- 
Dehydrogenase(Fig. 1 f; Fig. 2f). 

Pseudomonas sp. HR199^5QKm, enthaltend das durch QKm inaktivierte fcs~ 
Gen an Stelle des intakten ^c^-Gens kodierend fur Ferulasaure-CoA-Synthe- 
tase (Fig.lg; Fig. 2g). 

Pseudomonas sp, HR199/fc5'QGm, enthaltend das durch QGm inaktivierte fcs- 
Gen an Stelle des intakten fcs-Gens kodierend fiir Ferulasaure-CoA-Synthe- 
tase (Fig.lh; Fig. 2h). 

Pseudomonas sp. HR199/c5A, enthaltend das durch Deletion inaktivierte fcs- 
Gen an Stelle des intakten ^c^-Gens kodierend fur Ferulasaure-CoA-Synthe- 
tase (Fig.li; Fig. 2i). 

Pseudomonas sp. HR199ec/2QKm, enthaltend das durch QKm inaktivierte 
ech-Ge n an Stelle des intak ten ec/z-Gens kodierend fiir Enoyl-Co A- 
Hydratase-Aldolase (Fig.lj; Fig. 2j). 
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11. 



12. 



13. 



Pseudomonas sp. HR199ec/2QGm, enthaltend das durch QGm inaktivierte 
ec/2-Gen an Stelle des intakten ecA-Gens kodierend fiir Enoyl-CoA-Hydra- 
tase-Aldolase (Fig. Ik; Fig. 2k). 

Pseudomonas sp. HR199ecAA, enthaltend das durch Deletion inaktivierte ech- 
Gen an Stelle des intakten ech-Gens kodierend fiir Enoyl-CoA-Hydratase- 
Aldolase (Fi.ll; Fig. 21). 

Pseudomonas sp. HR199aa/QKm, enthaltend das durch QKm inaktivierte 
ggr-Gen an Stelle des intakten aat-Gcns kodierend fur beta-KetothioIase (Fig. 
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15. 



16. 



17. 



18. 



19. 



20. 
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Im; Fig. 2m). 

Pseudomonas sp, HR199aa/QGm, enthaltend das durch QGm inaktivierte 
aat-Gcn an Stelle des intakten aa^Gens kodierend ftir beta-Ketothio- 
lase(Fig.ln; Fig. 2n), 

Pseudomonas sp. HR199aarA, enthaltend das durch Deletion inaktivierte aat- 
Gen an Stelle des intakten aat-G^ns kodierend fur beta-Ketothiolase (Fig.lo; 
2o). 

Pseudomonas sp. HR199v<i/2QKm, enthaltend das durch QKm inaktivierte 
vdh-G^n an Stelle des intakten vdh-Gcns kodierend fiir Vanillin-Dehydroge- 
nase (Fig.lp; Fig. 2p). 

Pseudomonas sp. UK\99vdhQGm, enthaltend das durch QGm inaktivierte 
vdh-Gcn an Stelle des intakten vrf/z-Gens kodierend fur Vanillin-Dehydroge- 
nase (Fig.lq; Fig. 2q). 

Pseudomonas sp. HR199v£/AA, enthaltend das durch Deletion inaktivierte 
vdh-G^n an Stelle des intakten vdh-G^ns kodierend fur Vanillin-Dehydroge- 
nase (Fig,lr; Fig. 2r). 

Pseudomonas sp. HR199vc/A5QKm, enthaltend das durch QKm inaktivierte 
vdhB-Gcn an Stelle des intakten vdhB-Gens kodierend ftir Vanillin-Dehydro- 
genase II. 

Pseudomonas sp. HR199v^//z5QGm, enthaltend das durch QGm inaktivierte 
vdhB'GQn an St elle d es intakten vdhB-Gcns kodierend fiir Vanillin-Dehydro- 
genase II. 
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21. Pseudomonas sp. HR199v<^/;5A, enthaltend das durch Deletion inaktivierte 
vdhB~Gen an Stelle des intakten vdhB-Gens kodierend fur Vanillin-Dehydro- 
genase II , 

22. Pseudomonas sp. HR199a<i/zQKm, enthaltend das durch QKm inaktivierte 
adh-Gen an Stelle des intakten adh-Gens kodierend fur Alkohol-Dehydroge- 
nase. 

23. Pseudomonas sp. HR199fl<i/zQGm, enthaltend das durch QGm inaktivierte 
adh-Goxi an Stelle des intakten adh-GQns kodierend flir Alkohol-Dehydroge- 

nase. 

24. Pseudomonas sp. HR199a<ii^A enthaltend das durch Deletion inaktivierte adh- 
Gen an Stelle des intakten adh-Gcns kodierend fiir Alkohol-Dehydrogenase. 

25. Pseudomonas sp. HR199vart/4QKm, enthaltend das durch QKm inaktivierte 
vanA-Gcn an Stelle des intakten vaw^-Gens kodierend fur die a-Untereinheit 
der Vanillinsaure-Demethylase. 

26. Pseudomonas sp. HR\99vanAQ.Gm, enthaltend das durch QGm inaktivierte 
vanA-Gen an Stelle des intakten vanA-Gens kodierend fur die a-Untereinheit 
der Vanillinsaure-Demethylase. 

27. Pseudomonas sp, HR199va^L4A, enthaltend das durch Deletion inaktivierte 
vanA'Gcn an Stelle des intakten vanA-Gens kodierend flir die a-Untereinheit 
der Vanillinsaure-Demethylase. 

28. Pseudomonas sp. HR 1 99 van^QKm, enthaltend das durch QKm inaktivierte 
vanB-Gen an Stelle des intakten vanB-Gcns kodierend fur die P-Untereinheit 
der Vanillinsaure-Demethylase. 

29. Pseudomonas sp. HR199va/?5QGm, enthaltend das durch QGm inaktivierte 
vanB-GQn an Stelle des intakten vanB-Gens kodierend fur die P-Untereinheit 
der Vanillinsaure-Demethylase. 

30. Pseudomonas sp. HR199va«5A, enthaltend das durch Deletion inaktivierte 
vflrtjB-Gen an Stelle des intakten vanB-Gcns kodierend fur die p-Untereinheit 
der Vanillinsaure-Demethylase. 
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Gegenstand der Erfindung ist auCerdem ein Verfahren zur biotechnischen Herstel- 
lung von organischen Verbindungen. Insbesondere konnen mit diesem Verfahren 
Alkohole, Aldehyde und organische Sauren hergestellt werden. Vorzugsweise han- 
delt es sich hierbei urn Coniferylalkohol, Coniferylaldehyd, Ferulasaure, Vanillin und 
Vanillinsaure. 

In dem erfindungsgemafien Verfahren werden die oben beschriebenen Organismen 
eingesetzt. Zu den ganz besonders bevorzugten Organismen gehoren Bakterien, ins- 



besondere die Pseudomonas-Artcn, Im einzelnen konnen die oben genannten Pseu- 
domonas- Axicn vorzugsweise ftir folgende Verfahren eingesetzt werden: 

1. Pseudomonas sp. HR199ca/^QKm, Pseudomonas sp. HR199ca/^QGm und 
Pseudomonas sp. HR199caL4A zur Herstellung von Coniferylalkohol aus 
Eugenol. 

2. Pseudomonas sp. HR199ca/^QKm, Pseudomonas sp. HR199ca/5QGm und 
Pseudomonas sp. HR199ca/5A zur Herstellung von Coniferylaldehyd aus 
Eugenol oder Coniferylalkohol. 




Pseudomonas sp. HR199/c5QKm, Pseudomonas sp. HR199/c5'QGm, Pseu- 
domonas sp. HR199fcsA, Pseudomonas sp. HR199ec/zQKm, Pseudomonas 
sp. HR199ec/xQGm und Pseudomonas sp, HR199ec/zA zur Herstellung von 
Ferulasaure aus Eugenol oder Coniferylalkohol oder Coniferylaldehyd. 



25 
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Pseudomonas sp. HR199v<a?/zQKm, Pseudomonas sp. HR199v^//zQGm, Pseu- 
domonas sp. ¥LK\99vdhD, Pseudomonas sp. HR199vrf/2QGmvrf/z5QKm, 
Pseudomonas sp. }:lK\99vdhQKmvdhBO.Gm, Pseudomonas sp. 
HR199vrf/zAvi//25QGm und Pseudomonas sp. \{R\99vdh/^vdhBQKm zur 
Herstellung von Vanillin aus Eugenol oder Coniferylalkohol oder Coni- 



ferylaldehyd oder Ferulasaure. 
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5. Pseudomonas sp. HR199vafL4QKm, Pseudomonas sp. HR199va/i^nGm, 
Pseudomonas sp. HR199vaw/4A, Pseudomonas sp. HR199va«5QKm, 
Pseudomonas sp. HR199va/25nGm und Pseudomonas sp. liK\99vanBA zur 
Herstellung von Vanillinsaure aus Eugenol oder Coniferylalkohol oder 
Coniferylaldehyd oder Ferulasaure oder Vanillin. 



15 




25 



Bevorzugtes Substrat ist Eugenol. Jedoch kann der Zusatz weiterer Substrate oder 
sogar der Austausch des Eugenol gegen ein anderes Substrat moglich sein. 

Als Nahrmedium fur die erfindungsgemali eingesetzten Organismen kommen syn- 
thetische, halbsynthetische oder komplexe Kulturmedien in Betracht. Diese konnen 
kohlenstoffhaltige und stickstoffhaltige Verbindungen, anorganische Salze, gegebe- 
nenfalls Spurenelemente sowie Vitamine enthalten. 

Als kohlenstoffhaltige Verbindungen k6nnen Kohlenhydrate, Kohlenwasserstoffe 
oder organische Grundchemikalien in Betracht kommen. Beispiele fiir vorzugsweise 
verwendbare Verbindungen sind Zucker, Alkohole bzw. Zuckeralkohole, organische 
Sauren oder komplexe Gemische. 

Als Zucker kommt vorzugsweise Glucose in Betracht. Als organische Sauren konnen 
vorzugsweise Zitronensaure oder Essigsaure zum Einsatz kommen. Zu den kom- 
plexen Gemischen zahlen z. B. Malzextrakt, Hefeextrakt, Casein oder Caseinhydro- 
lysat. 

Als stickstoffhaltige Substrate kommen anorganische Verbindungen in Betracht. Bei- 
spiele hierfiir sind Nitrate und Ammoniumsalze. Ebenso konnen organische Stick- 
stoffquellen zum Einsatz kommen. Hierzu zahlen Hefeextrakt, Sojamehl, Casein, 
Caseinhydrolysat und Maisquellwasser. 
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Zu den einsetzbaren anorganischen Salzen zahlen beispielsweise Sulfate, Nitrate, 
Chloride, Carbonate und Phosphate. Als Metalle enthalten die genannte Salze vor- 
zugsweise Natrium, Kalium, Magnesium, Mangan, Calcium, Zink und Eisen, 

5 Die Temperatur fur die Kultivierung liegt vorzugsweise im Bereich von 5 bis 100°C. 
Besonders bevorzugt ist der Bereich von 15 bis 60°C, hochst bevorzugt sind 22 bis 
37°C. 



Der pH-Wert des Mediums betragt bevorzugt 2 bis 12. Besonders bevorzugt ist der 
^^^^^^1 0 Bereich von 4 bis 8. 

Grundsatzlich konnen fur die Durchfuhrung des erfindungsgemaUen Verfahrens alle 
dem Fachmann bekannten Bioreaktoren eingesetzt werden. Vorzugsweise kommen 
alle fiir Submersverfahren geeigneten Vorrichtungen in Betracht. Das heiBt, es 
1 5 konnen erfindungsgemaB GefaBe ohne oder mit mechanischer Mischeinrichtung ein- 
gesetzt werden. Zu ersteren zahlen z. B. Schiittelapparaturen, Blasensaulen- oder 
Schlaufenreaktoren. Zu letzteren gehoren vorzugsweise alle bekannten Vorrichtun- 
gen mit Riihrem in beliebiger Gestaltung. 

20 Das erfindungsgemaBe Verfahren kann kontinuierlich oder diskontinuierlich durch- 
^^^^^^ gefuhrt werden. Die Dauer der Fermentation bis zum Erreichen einer maximalen 

^^^^r Produktmenge hangt von der speziellen Art des eingesetzten Organismus ab. Grund- 

satzlich liegen die Zeiten der Fermentation jedoch zwischen 2 und 200 Stunden. 

25 Im folgenden wird die Erfindung unter Bezugnahme auf Beispiele naher erlautert: 

Von dem Eugenol verwertenden Stamm Pseudomonas sp. HR199 (DSM 7063) wur- 
den gezieh Mutanten erzeugt, wobei spezifisch Gene des Eugenol-Katabolismus 
durch In sertio n von Omega-Elementen oder durch Einfiihren von Deletionen inaktj- 
30 viert vymrden. Als Omega-Elemente dienten DNA-Abschnitte die fur Antibiotika- 
resistenzen gegen Kanamycin (QKm) und Gent2imycin (QGm) codierten. Diese 
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Resistenzgene wurden ausgehend von Tn5 und dem Plasmid pBBRlMCS-5 mit 
Hilfe von Standardmethoden isoliert. Die Gene calA, caIB,/cs, ech, aai, vdh, adh, 
vdhB, vanA und vanB, die fur Coniferylalkohol-Dehydrogenase, Coniferylaldehyd- 
Dehydrogenase, Ferulasaure-CoA Synthetase, Enoyl-CoA Hydratase-Aldolase, beta- 
5 Ketothiolase, Vanillin-Dehydrogenase, Alkohol-Dehydrogenase, Vanillin-Dehydro- 
genase II und Vanillinsaure-Demethylase codieren wurden ausgehend von genomi- 
scher DNA des Stammes Pseudomonas sp. HR199 mit Hilfe von Standardmethoden 
isoliert und in pBluescript SK' kloniert. Aus diesen Genen wurden durch Verdauung 
mit geeigneten Restriktionsendonukleasen DNA-Abschnitte entfemt (Deletion), bzw 
^^^^^^0 durch Q-Elemente substituiert (Insertion), wodurch das jeweilige Gen inaktiviert 
^^^B wurde. Die auf diese Weise mutierten Gene wurden in konjugativ iibertragbare Vek- 

toren umkloniert und anschlieBend in den Stamm Pseudomonas sp. HR199 einge- 
fuhrt. Durch geeignete Selektion wurden Transkonjuganten erhalten, die das jeweils 
funktionsfahige wildtyp-Gen gegen das neu eingebrachte inaktivierte Gen ausge- 
1 5 tauscht hatten. Die so erhaltenen Insertions- und Deletionsmutanten wiesen nur noch 
das jeweils inaktivierte Gen auf. Auf diese Weise wurden sowohl Mutanten mit nur 
einem defekten Gen als auch Mehrfachmutanten, in denen mehrere Gene auf diese 
Weise inaktiviert wurden, erhalten. Diese Mutanten wurden fur die Biotransforma- 
tion von 

20 a) Eugenol zu Coniferylalkohol, Coniferylaldehyd, Ferulasaure, Vanillin und/oder 
^l^^^k Vani 1 1 insaure ; 

^^^V b) Coniferylalkohol zu Coniferylaldehyd, Ferulasaure, Vanillin und/oder 

Vanillinsaure; 

c) Coniferylaldehyd zu Ferulasaure, Vanillin und/oder Vanillinsaure; 
25 d) Ferulasaure zu Vanillin und/oder Vanillinsaure und 
e) Vanillin zu Vanillinsaureeingesetzt. 
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Material und Methoden 
Wachstumsbedingungen der Bakterien. 

Stamme von Escherichia coli wurden bei 3TC in Luria-Bertani (LB) oder M9-Mine- 
ralmedium (Sambrook, J., E. F. Fritsch und T. Maniatis. 1989. Molecular cloning: a 
laboratory manual. 2. Aufl., Cold Spring Harbor Laboratory Press, Cold Spring 
Harbor, New York.) angezogen. Stamme von Pseudomonas sp. wurden bei 30°C in 
Nutrient Broth (NB, 0,8%, wt/vol) oder in Mineralmedium (MM) (Schlegel, H, G. et 
ni lo^i A.ou Milrrnh inl ? S- ^0^ ^^^) bm MiWnim r rliiim (t^t^ mm;^ 
(Rabenhorst, J, 1996. Appl. Microbiol. Biotechnol. 46:470-474.) angezogen, Ferula- 
saure. Vanillin, Vanillinsaure und Protocatechusaure wurden in Dimethylsulfoxid 
gelost, und dem jeweiligen Medium in einer Endkonzentration von 0.1% (w^vol) 
zugesetzt. Eugenol wurde dem Medium direkt in einer Endkonzentration von 0.1% 
(vol/vol) zugesetzt, bzw. in den Deckel von MM-Agarplatten auf Filterpapier 
(Rundfilter 595, Schleicher & Schuell, Dassel, Deutschland) appliziert. Bei der 
Anzucht von Transkonjuganten und Mutanten von Pseudomonas sp. wurde Tetra- 
cyclin, Kanamycin, und Gentamycin in Endkonzentrationen von 25 jig/ml bzw. 100 
\xg/m\ bzw. 7,5 ^g/ml eingesetzt. 

Qualitativer und quantitativer Nachweis von Stoffwechselintermediaten in Kul- 
turiiberstanden. 

Kulturuberstande v^rden direkt, bzw. nach Verdunnung mit H20-bidest. mittels 
Hochdruck-Flussigkeits-Chromatographie (Knauer-HPLC) analysiert. Die Chroma- 
tographic erfolgte an Nucleosil-100 C18 (7 }am, 250 x 4 mm). Als Losungsmittel 
diente 0.1% (vol/vol) Ameisensaure und Acetonitril. Der verwendete Gradient zur 
Elution der Substanzen verlief wie folgt: 

00:00 - 06:30 26% Acetonitril 
06:30 - 08:00 -> 100% Acetonitril 
08:00 - 12:00 ^ 100% Acetonitril 
1 2:00 - iTOO ^ 26% Acetonitril 
13:00 - 18:00 26% Acetonitril 
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Reinigung der Vanillin-Dehydrogenase-II. 

Die Aufreinigung erfolgte bei 4°C. 



5 Rohextrakt. 

Auf Eugenol angezogene Zellen von Pseudomonas sp. HR199 wurden in 10 mM 
Natriumphosphat-Puffer, pH 6,0 gewaschen, im gleichen Puffer resuspendiert und 

durch zweimalige Passage einer French-Presse (Amicon, Silver Spring, Maryland, 

USA) bei einem Druck von 1000 psi aufgeschlossen. Das Zellhomogenat wurde 

^^^^^^10 einer Ultrazentrifugation (1 h, 100 000 x g, 4*^0) unterzogen, wodurch die losiiche 
^^^B Fraktion des Rohextraktes als Uberstand erhalten wurde. 

Atiionenaustauschchromatographie an DEAE-Sephacel. 

Die losiiche Fraktion des Rohextraktes wurde iiber Nacht gegen 10 mM Natrium- 
15 phosphat-Puffer, pH 6.0 dialysiert. Das Dialysat wurde auf eine mit 10 mM 
Natriumphosphat-Puffer, pH 6.0 aquilibrierte DEAE-Sephacel-Saule (2,6 cm x 35 
cm, Bettvolumen[BV]: 186 ml) mit einer DurchfluBrate von 0.8 ml/min aufgetragen. 
Die Saule wurde mit zwei BV 10 mM Natriumphosphat-Puffer, pH 6.0 gespiilt. Die 
Elution der Vanillin-Dehydrogenase-II (VDH-II) erfolgte mit einem linearen Salz- 
20 gradient von 0 bis 400 mM NaCl in 10 mM Natriumphosphat-Puffer, pH 6.0 (750 
^l^^^k ml). Es wurden 10 ml-Fraktionen aufgefangen. Fraktionen mit hoher VDH-II- Akti- 

^^^^m vital wurden zum DEAE-Pool vereinigt. 



I Bestimmung der Vanillin-Dehydrogenase-Aktivitat. 

' 25 Die Bestimmung der VDH-Aktivitat erfolgte bei 30°C durch einen optisch enzyma- 

' tischen Test. Der Reaktionsansatz mit einem Volumen von 1 ml enthielt 0. 1 mmol 

I 

Kalium-Phosphat (pH 7.1), 0.125 ^mol VaniUin, 0.5 ^imol NAD, 1.2 \xmo\ Pyruvat 

I 

I (Na-Salz), Lactat-Dehydrogenase (1 U; aus Schweineherz ) und Enzymlosung. Die 

I Oxidation jvon Vanillin wurde bei X = 340 nm verfolgt (s vanillin = 1 1,6 cm^/^mol). 

' 30 Die Enzymaktivitat wurde in Einheiten (U) angegeben, wobei 1 U der Enzymmenge 

entspricht, die 1 |xmol Vanillin pro Minute umsetzt. Die Proteinkonzentrationen in 

I 

i 
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den Proben wurden nach Lowry et al. (Lowry, O. H., N. J. Rosebrough, A. L. Farr 
und R. J. Randall. 1951. J. Biol. Chem. 193:265-275) bestimmt 

Bestimmung der Coniferyialkohol-Dehydrogenase-Aktivitat, 

Die Bestimmung der CADH-Aktivitat erfolgte bei 30°C durch einen optisch enzy- 
matischen Test nach Jaeger et al. (Jaeger, E., L. Eggeling und H. Sahm. 1981. 
Current Microbiology. 6:333-336). Der Reaktionsansatz mit einem Volumen von 
1 ml enthielt 0.2 mmol Tris/HCl (pH 9.0), 0.4 umol Conifer ylalkohol, 2 lamol NAD, 
0.1 mmol Semicarbazid und Enzymlosung. Die Reduktion von NAD wurde bei X = 
340 nm verfolgt (s = 6.3 cm2/|imol). Die Enzymaktivitat woirde in Einheiten (U) 
angegeben, v^obei 1 U der Enzymmenge entspricht, die 1 |amol Substrat pro Minute 
umsetzt. Die Proteinkonzentrationen in den Proben wurden nach Lowry et al. 
(Lowry, O. H., N. J. Rosebrough, A. L. Farr und R. J. Randall. 1951. J. Biol. Chem. 
193:265-275) bestimmt. 

Bestimmung der Coniferylaldehyd-Dehydrogenase-Aktivitat. 

Die Bestimmung der CALDH-Aktivitat erfolgte bei 30'*C durch einen optisch enzy- 
matischen Test. Der Reaktionsansatz mit einem Volumen von 1 ml enthielt 0.1 mmol 
Tris/HCl (pH 8.8), 0.08 |Limol Coniferylaldehyd, 2.7 jimol NAD und Enzymlosung. 
Die Oxidation von Coniferylaldehyd zu Ferulasaure woirde bei X = 400 nm verfolgt 
(e = 34 cm2/^imol). Die Enzymaktivitat wurde in Einheiten (U) angegeben, wobei 1 
U der Enzymmenge entspricht, die 1 ^imol Substrat pro Minute umsetzt. Die Pro- 
teinkonzentrationen in den Proben wurden nach Lowry et al. (Lowry, O. H,, N. J. 
Rosebrough, A. L. Farr und R. J. Randall. 1951. J. Biol. Chem. 193:265-275) 
bestimmt. 

Bestimmung der Ferulasaure-CoA-Synthetase (Ferulasaure-Thiokinase)-Aktivi- 
tat. 

Die BestimmuuR d er FCS-Aktiyitat erfolgte^ bei 30°C durch einen optisch enzyma- 
tischen Test, modifiziert nach Zenk et al. (Zenk et al. 1980. Anal. Biochem. 101:182- 
187). Der Reaktionsansatz mit einem Volumen von 1 ml enthielt 0.09 mmol Kalium- 
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Phosphat (pH 7.0), 2.1 iimol MgCl2, 0.7 |imol Ferulasaure, 2 |imoi ATP, 0.4 jimol 
Coenzym A unci Enzymlosung. Die Entstehung des CoA-Esters aus Ferulasaure 
wxirde bei k = 345 run verfolgt (s = 10 cm^/fimol). Die Enzymaktivitat wurde in 
Einheiten (U) angegeben, wobei 1 U der Enzymmenge entspricht, die 1 |imol Sub- 
5 strat pro Minute umsetzt. Die Proteinkonzentrationen in den Proben warden nach 
Lowry et al. (Lowry, O. H., N. J. Rosebrough, A. L. Farr und R. J. Randall. 1951. J. 
Biol. Chem. 193:265-275) bestimmt. 



15 




25 



Electrophoretische Methoden. 

Die Auftrennung von proteinhaltigen Extrakten erfolgte in 7.4% (wt/vol) Poly- 
acrylamidgelen unter nativen Bedingungen nach der Methode von Stegemann et al. 
(Stegemann et al. 1973. Z. Naturforsch. 28c: 722-732) und unter denaturierenden 
Bedingungen in 1 1.5% (wt/vol) Polyacrylamidgelen nach der Methode von Laemmli 
(Laemmli, U. K. 1970. Nature (London) 227:680-685). Zur unspezifischen Protein- 
farbung wurde Serva Blue R verwendet. Zur spezifischen Anfarbung der Conife- 
rylalkohol-, Coniferylaldehyd- und Vanillin-Dehydrogenase wurden die Gele fur 20 
min in 100 mM KP-PufFer (pH 7.0) umgepuffert und anschlieBend bei 30"^ C im glei- 
chen Puffer dem 0.08% (wt/vol) NAD, 0.04% (wt/vol) p-Nitroblau-Tetrazolium- 
chlorid, 0.003% (wt/vol) Phenazine-Methosulfat und 1 mM des jeweiligen Substrates 
zugesetzt worden war inkubiert, bis entsprechende Farbbanden sichtbar wurden. 

Transfer von Proteinen aus Polyacrylamidgelen auf PVDF-Membranen. Pro- 
teine wurden aus SDS-Polyacrylamidgelen mit Hilfe eines Semidry-Fastblot Gerates 
(B32/33, Biometra, Gottingen, Deutschland) nach Herstellerangaben auf PVDF- 
Membranen (Waters-Mil ipore, Bedford, Mass., USA) ubertragen. 



30 



Bestimmung von N-terminalen Aminosauresequenzen. 

Die Bestimmung von N-terminalen Aminosauresequenzen erfolgte mit Hilfe eines 
Protein Peptide Sequenzers (Typ 477 A, Applied Biosystems, Foster City, USA) und 
eines PTH-Analysers nach Herstellerangaben. 
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Isolierung und Manipulation von DNA. 

Die Isolierung von genomischer DNA erfolgte nach der Methode von Marmur 
(Marmur, J. 1961. J. Mol. Biol. 3:208-218). Die Isolierung und Analyse von anderer 
Plasmid-DNA bzw. von DNA-Restriktionsfragmenten erfolgte nach Standardmetho- 
den (Sambrook, J. E. F. Fritsch und T. Maniatis. 1989. Molecular cloning: a labora- 
tory manual. 2. Aufl., Cold Spring Harbor Laboratory Press, Cold Spring Habor, 
New York.). 



15 




Transfer von DNA. 

Die Praparation und Transformation von kompetenten Escherichia coli-Zellcn 
erfolgte nach der Methode von Hanahan (Hanahan, D. 1983. J. Mol. Biol. 166:557- 
580). Konjugativer Plasmidtransfer zwischen Plasmid-tragenden Escherichia coli 
S17-1-Stammen (Donor) und Pseudomonas sp.-Stammen (Rezipient) erfolgte auf 
NB-Agarplatten nach der Methode von Friedrich et al. (Friedrich, B. et al. 1981. J. 
Bacteriol. 147:198-205), oder durch eine "Minikomplementations-Methode" auf 
MM-Agarplatten mit 0.5% (wt/vol) Gluconat als C-Quelle und 25 \xglm\ Tetracyclin 
Oder 100 \x%/m\ Kanamycin. Dabei wurden Zellen des Rezipienten in einer Richtung 
als Impfstrich aufgetragen. Nach 5 min wurden dann Zellen der Donor-Stamme als 
Impfstriche aufgetragen, wobei der Rezipienten-Impfstrich gekreuzt wurde. Nach 
einer Inkubation fur 48 h bei 30°C wuchsen die Transkonjuganten direkt hinter der 
Kreuzungsstelle, wohingegen weder Donor- noch Rezipienten-Stamm zum Wachs- 
tum in der Lage war. 



25 



30 



Hybridisierungsexperimente. 

DNA-Restriktionsfragmente wurden in einem 0.8% (wt/vol) Agarose-Gel in 50 mM 
Tris- 50 mM Borsaure- 1.25 mM EDTA-Puffer (pH 8.5) elektrophoretisch aufge- 
trennt (Sambrook, J. E. F. Fritsch und T. Maniatis. 1989. Molecular cloning: a 
laboratory manual. 2. Aufl., Cold Spring Harbor Laboratory Press, Cold Spring 
Habor, New York.) . Die Ubertragung der denaturierten DNA aus dem Gel auf eine 
positiv geladene Nylonmembran (PorengroBe: 0.45 ^im. Pall Filtrationstechnik, Drei- 
eich, Deutschland), die anschlieBende Hybridisierung mit biotinylierten, bzw. 
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Digoxigenin-markierten DNA-Sonden und die Herstellung dieser DNA-Sonden 
erfolgte nach Standardmethoden (Sambrook, J. E. F. Fritsch und T. Maniatis. 1989. 
Molecular cloning: a laboratory manual. 2. Aufl., Cold Spring Harbor Laboratory 
Press, Cold Spring Habor, New York.). 




DNA-Sequenzierung. 

Die Bestimmung von Nukleotidsequenzen erfolgte nach der Didesoxy-Kettenab- 
bruch-Methode von Sanger et al. (Sanger et al. 1977. Proc. Natt. Acad. Sci. USA 
74:5463-5467) "nicht-radioaktiv" mit einem "LI-COR DNA-Sequencer Modell 
4000L" (LI-COR Inc., Biotechnology Division, Lincoln, NE, USA) unter Verwen- 
dung eines "Thermo Sequenase fluorescent labelled primer cycle sequencing kit with 
7-deaza-dGTP" (Amersham Life Science, Amersham International pis. Little 
Chalfont, Buckinghamshire, England) jeweils nach Vorschrift des Herstellers. 



15 Mit Hilfe von synthetischen Oligonukleotiden wurde nach der "Primer-hopping 
Strategic" von Strauss et al. (Strauss, E. C. et al. 1986. Anal. Biochem. 154:353-360) 
sequenziert. 




25 



Chemikalien, Biochemikalien und Enzyme. 

Restriktionsenzyme, T4 DNA-Ligase, Lambda-DNA und Enzyme bzw. Substrate fur 
die optisch enzymatischen Tests wurden von C. F. Boehringer & Sohne (Mannheim, 
Deutschland) oder von GIBCO/BRL (Eggenstein, Deutschland) bezogen. [y- 
32p]ATP kam von Amersham/Buchler (Braunschweig, Deutschland). Oligonukleo- 
tide wurden von der Firma MWG-Biotech GmbH (Ebersberg, Deutschland) bezogen. 
Agarose vom Typ NA wurde von Pharmacia-LKB (Uppsala, Schweden) bezogen. 
Alle anderen Chemikalien waren von Haarmann & Reimer (Holzminden, Deutsch- 
land), E. Merck AG (Darmstadt, Deutschland), Fluka Chemie (Buchs,, Schweiz), 
Serva Feinbiochemica (Heidelberg, Deutschland) oder Sigma Chemie (Deisenhofen, 
Deutschland). 
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Beispiele 
Beispiel 1 

5 Konstruktion von Omega-Elementen, die Resistenzen gegenuber Kanamycin (Q 
Km) bzw. Gentamycin( QGm) vermitteln. 

Fur die Konstruktion des QKm-Elements wurde das 2099 bp 5g/I-Fragment des 
Transposons Tn5 TAuerswald E, A- G . Ludwig und H . Schaller , _1981 . Cold Spring . 
Harb. Symp. Quant. Biol. 45:107-113; Beck E., G. Ludwig, E. A. Auerswald, B. 
^I^^^O Reiss und H. Schaller. 1982. Gene 19:327-336; Mazodier P., P. Cossart, E. Giraud 
^^^^m und F. Gasser. 1985. Nucleic Acids Res. 13:195-205.) praparativ isoliert. Das Frag- 

ment wurde durch Behandlung mit der Nuklease Bal-31 auf ca. 990 bp verkiirzt. 
Dieses Fragment, das nur noch das Kanamycin-Resistenzgen (codierend flir eine 
Aminoglycosid-3'-0-Phosphotransferase) umfaBte, wurde anschlieBend mit Smal 
15 geschnittener pSKsym-DNA (pBluescript SK"-Derivat, welches eine symetrisch auf- 
gebaute multiple Klonierungsstelle [Sa/I, Hindlll, EcoRI, Smal, EcoRl, Hindlll, SaK] 
enthalt) ligiert. Aus dem resultierenden Plasmid konnte das QKm-Element als Smal~, 
EcoRI-^ Hindlll' oder iSa/I-Fragment reisoliert werden. 

^^^^ 20 Fiir die Konstruktion des QGm-Elements wurde das 983 bp ^^el-Fragment des 
^^^^ Plasmids pBBRlMCS-5 (Kovach M.E,, P. H. Elzer, D. S. Hill, G. T. Robertson, M. 

^^^^ A. Farris, R. M. Roop und K. M. Peterson. 1995. Gene 166:175-176.) praparativ iso- 

liert und anschlieBend mit Mung Bean Nuklease (Abdauen von einzelstrangigen 
DNA-Molekiilenden) behandelt. Dieses Fragment, das nur noch das Gentamycin- 
25 Resistenzgen (codierend fur eine Gentamycin-3-AcetyItransferase) umfaBte, wurde 
anschlieBend mit Smal geschnittener pSKsym-DNA (s.o.) ligiert. Aus dem resultie- 
renden Plasmid konnte das QGm-Element als Smal-, EcoRl-, Hindlll- oder Sail- 
Fragment reisoliert werden. 
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Beispiei 2 




Klonierung der Gene aus Pseudomonas sp. HR199 (DSM7063), die durch Inser- 
tion von Q-£lementen oder durch Deletionen inaktiviert werden soUten. 

Die separaten Kloniemngen der Gene fcs^ ech^ vdh und aat erfolgte ausgehend von 
den E, coli S17-1 Stammen DSM 10439 und DSM 10440 mit den Plasmiden pE207 
und pE5-l (siehe EP-A 0845532). Aus diesen Plasmiden wurden die angegebenen 
■^Fragmente praparativ isoliert und wie im weiteren beschrieben behandelt: _ 

Fiir die Klonierung des ^c^-Gens wurde das 2350 bp groBe 5a/I/£^coRI-Fragment des 
Plasmids pE207 und das 3700 bp groBe £coRI/iSa/I-Fragment des Plasmids pE5-l 
zusammen in pBluescript SK" in einer Weise kloniert, daB beide Fragmente tiber die 
£^coRI-Enden miteinander verbunden v^aren. Ausgehend von dem resultierenden 
Hybridplasmid wurde das 6050 bp iSa/I-Fragment praparativ isoliert und durch 
1 5 Behandlung mit der Nuklease Bal-3 1 auf ca. 2480 bp verkurzt. AnschlieBend wurden 
an die Fragment-Enden P^/I-Linker ligiert und das Fragment nach P^rt-Verdauung in 
pBluescript SK' kloniert (pSK/c^). Nach Transformation von E. coli XL 1 -Blue wur- 
den Klone erhalten, die das fcs-GQn exprimierten und eine FCS-Aktivitat von 0.2 
U/mg Protein aufwiesen. 



Fiir die Klonierung des ec/j-Gens wurde das 3800 bp groBe ^/ndIII/£'coRI-Fragment 
des Plasmids pE207 praparativ isoliert und durch Behandlung mit der Nuklease Bal- 
31 auf ca, 1470 bp verkurzt. AnschlieBend wurden an die Fragment-Enden EcoKl- 
Linker ligiert und das Fragment nach EcoRI-Verdauung in pBluescript SK' kloniert 
25 (pSKec/z). 



30 



Fiir die Klonierung des vdh-Goxis wurde das 2350 bp groBe Sa/I/^coRI-Fragment des 
Plasmids pE207 praparativ isoliert. Nach Klonierung in pBluescript SK" wurde das 
Fragme nt m it Hilfe eines Exonuklease 111/ Mung Bean Nukleasesystems einseitig^ 
um ca. 1530 bp verkiirzt. AnschlieBend wurde an das Fragmentende ein £coRI- 
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Linker ligiert und das Fragment nach £coRI-Verdauung in pBluescript SK" kloniert 
(pSKvdh), Nach Transformation von E, coli XL 1 -Blue wurden Klone erhalten, die 
das vdh-G^n exprimierten und eine VDH-Aktivitat von 0.01 U/mg Protein 
aufwiesen. 

Fur die Klonierung des aa^Gens wurde das 3700 bp groBe £'coRI/5'a/I-Fragment des 
Plasmids pE5-l praparativ isoliert und durch Behandlung mit der Nuklease Bal-31 
auf ca. 1590 bp verkurzt. Anschliefiend wurden an die Fragment-Enden EcoKL- 
Linker ligiert und das Fragment nach £coRI-Verdauung in pBluescript SK' kloniert 
(pSKa^O. 

Bcispiel 3 

Inaktivierung der oben beschriebenen Gene durch Insertion von Q-EIementen, 
bzw durch Deletion von Teilbereichen dieser Gene. 

Das Plasmid pSK/c^-, welches das ^c^-Gen enthielt wurde mit ^^^HII verdaut, 
wodurch ein 1290 bp groGes Fragment aus dem fcs-G^n herausgeschnitten wurde. 
Nach Religation wurde das Deletions-Derivat des ^^-Gens (/c^-A) (siehe Abb. 1 i und 
2i) kloniert in pBluescript SK" (pSKfcs/Hi) erhalten, Daniber hinaus wurden nach 
Herausschneiden des Fragments die Omega-Elemente QKm und QGm an dessen 
Stelle einligiert. Dadurch entstanden die Q-inaktivierten Derivate des ^c^-Gens (fcsQ. 
Km, siehe Abb. Ig und 2g)und {fcsQ.Gm, siehe Abb. Ih und 2h) kloniert in 
pBluescript SK" (pSK^^QKm und pSK/c^QGm). In Rohextrakten der erhaltenen E. 
coli Klone, deren Hybridplasmide ein durch Deletion bzw. Q-Element-Insertion 
inaktiviertes ^c^-Gen aufwiesen, konnte keine FCS-Aktivitat nachgewiesen werden. 

Das Plasmid pSKec/z, welches das ech-G^n enthielt, wurde mit Nru\ verdaut, 
wodurch ein 53 bp und ein 430 bp groBes Fragment aus dem ech-G^n herausge- 
schnittenjwurde. Nach Religation wurde das Deletions-Derivat des ech-Gcns {echt^, 
siehe Abb. 11 und 21) kloniert in pBluescript SK" (pSK^c/zA) erhalten. Daruber 
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hinaus wurden nach Herausschneiden der Fragmente die Omega-Elemente QKm und 
QGm an deren Stelle einligiert. Dadurch entstanden die Q-inaktivierten Derivate des 
ech'Gtns (echOKm und echQ.Gm) kloniert in pBluescript SK' (pSKecAQKm und 
pSKechnGm). 

5 

Das Plasmid pSKvdh, welches das vdh-Gon enthielt wurde mit ^^^HII verdaut, 
wodurch ein 210 bp grofies Fragment aus dem vdh-Gcn herausgeschnitten wurde. 
Nach Relippitinn wiirHe d?^<; Deletionf^-Derivat. des v^/z-Gens (vdhA, siehe Abb. 1o 
und 26) kloniert in pBluescript SK' (pSKvrf/zA) erhalten. Dariiber hinaus wurden 
^^^^^^^0 nach Herausschneiden des Fragments die Omega-Elemente QKm und QGm an 
^^^^V dessen Stelle einligiert. Dadurch entstanden die Q-inaktivierten Derivate des vdh- 

Gens (ydhOKm und vdhQ.Gm) kloniert in pBluescript SK" (pSKvrf/zQKm, siehe 
Abb. Im und 2m) und (pSKvcf/zQGm, siehe Abb. In und 2n). In Rohextrakten der 
erhaltenen E. coli Klone, deren Hybridplasmide ein durch Deletion bzw, Q-Element- 
15 Insertion inaktiviertes vdh-Gt>n aufwiesen, konnte keine VDH-Aktivitat nachge- 
wiesen werden. 




Das Plasmid pSKaar, welches das aat-Gcn enthielt wurde mit ^^^-HII verdaut, 
wodurch ein 59 bp grofies Fragment aus dem aat-G^n herausgeschnitten wurde. 
Nach Religation wurde das Deletions-Derivat des aa/-Gens (aatA, siehe Abb. Ir und 
2r) kloniert in pBluescript SK' (pSKaa/A) erhalten. Dariiber hinaus wurden nach 
Herausschneiden des Fragments die Omega-Elemente QKm und QGm an dessen 
Stelle einligiert. Dadurch entstanden die Q-inaktivierten Derivate des aat-Gcns (aat 
QKm, siehe Abb. Ip und 2p) und (aa/QGm, siehe Abb. Iq und 2q) kloniert in 
25 pBluescript SK" (pSKaatZQKm und pSKaatOGm). 
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Beispiel 4 

Umklonieren der durch Q-EIemente inaktivierten Gene in das konjugativ iiber- 
tragbare "Suizid-Plasmid" pSUP202. 

5 Um die durch Q-Elemente inaktivierten Gene in Pseudomonas sp. HR199 gegen die 
intakten Gene austauschen zu konnen, benotigt man einen Vektor, der einerseits in 
Pseudomonaden iibertragen werden kann (konjugativ iibertragbare Plasmide), ande- 
rerseits dort jedoch nicht repliziert v^erden kann und somit in Pseudomonaden instgLi. 
bil ist ("Suizid-Plasmid"). DNA-Abschnitte, die mit Hilfe eines solchen Plasmid- 
^^^^^^^0 systems in Pseudomonaden iibertragen werden, konnen nur erhalten bleiben, wenn 
^^^^V sie durch homologe Rekombination (RecA-abhangige Rekombination) in das Genom 

der Bakterienzelle integriert werden. Im vorliegenden Fall wiirde das "Suizid- 
Plasmid" pSUP202 (Simon et al. 1983. In: A. Puhler. Molecular genetics of the 
bacteria-plant interaction. Springer Verlag, Berlin, Heidelberg, New York, S. 98- 
15 1 06.) eingesetzt. 

Die inaktivierten Gene Jfc^QKm und ^c^-QGrn wurden nach P^rt-Verdauung aus den 
Plasmiden pSK/c^QKm und pSK^^QGm isoliert und mit Pstl geschnittener 
pSUP202 DNA ligiert. Die Ligationsansatze wurden nach E. coli SI 7-1 transfor- 
20 miert. Die Selektion erfolgte auf Tetracyclin-haltigem LB-Medium mit Kanamycin 
^^^^^^k bzw. Gentamycin. Es wurden Kanamycin-resistente Transformanden erhalten, deren 

^^^^r Hybridplasmid (pSUP^fc^QKm) das inaktivierte Gen yt^-QKm enthielt. Das entspre- 

chende Hybridplasmid (pSUPyc^-QGm) der Gentamycin- resistenten Transformanden 
enthielt das inaktivierte Gen ^^QGm. 

25 

Die inaktivierten Gene echOKm und echQGm wurden nach £^coRI-Verdauung aus 
den Plasmiden pSKec/zQKm und pSKec/zQGm isoliert und mit EcoKl geschnittener 
pSUP202 DNA ligiert. Die Ligationsansatze wurden nach E. coli 81 7-1 transfor- 
miert. Die Selektion erfolgte auf Tetracyclin-haltigem LB-Medium mit Kanamycin 
30 bzw. Gentamycin. Es wurden Kanamycin-resistente Transformanden erhalten, deren 
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Hybridplasmid (pSVPechQKxn) das inaktivierte Gen echQKm enthielt. Das entspre- 
chende Hybridplasmid (pSUPecAQGm) der Gentamycin- resistenten Transforman- 
den enthielt das inaktivierte Gen echOGm. 

5 Die inaktivierten Gene vdhQKm und vdhQ,Gm wurden nach jBcoRJ-Verdauung aus 
den Plasmiden pSKvdhQKm und pSKvdhQ,Gm isoliert und mit EcoRl geschnittener 
pSUP202 DNA ligiert. Die Ligationsansatze wurden nach E, coli SI 7-1 transfor- 
miert. Die Selektion erfolgte auf Tetracyclin-haltigem LB-Medium mit Kanamycin 
bzw. Gentamycin. Es wurden Kanamycin-resistente Transformanden erhalten, deren 
^^^^^^0 Hybridplasmid (pSUPvrf/zQKm) das inaktivierte Gen vdhQKm enthielt. Das entspre- 
^^^^B chende Hybridplasmid (pSUPv(i/zQGm) der Gentamycin- resistenten Transforman- 

den enthielt das inaktivierte Gen vdhQGm, 

Die inaktivierten Gene aatQKm und aatQGm wurden nach EcoRI-Verdauung aus 
15 den Plasmiden pSK^ra/QKm und pSKaa/QGm isoliert und mit £coRI geschnittener 
pSUP202 DNA ligiert. Die Ligationsansatze wurden nach E. coli SI 7-1 transfor- 
miert. Die Selektion erfolgte auf Tetracyclin-haltigem LB-Medium mit Kanamycin 
bzw. Gentamycin. Es wurden Kanamycin-resistente Transformanden erhalten, deren 
Hybridplasmid (pSUPa<3rQKm) das inaktivierte Gen aa/QKm enthielt. Das entspre- 
20 chende Hybridplasmid (pSUPaa/QGm) der Gentamycin- resistenten Transformanden 
^^^^^^^ enthielt das inaktivierte Gen aatQ,Gm. 

Beispiel 5 

25 Umklonieren der durch Deletion inaktivierten Gene in das konjugativ Uber- 
tragbare "Suizid-Plasmid'' mit *'^ac«-Selektionssystem" pHE55. 

Um die durch Deletion inaktivierten Gene in Pseudomonas sp. HR199 gegen die 
intakten Gene austauschen zu konnen, benotigt man einen Vektor, der die schon flir 
pSUP202 beschriebenen Eigenschaften aufweist. Da im Gegensatz zu den durch Q- 
30 Element inaktivierten Genen bei durch Deletion inaktivierten Genen keine Selek- 
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tionsmoglichkeit (keine Antibiotika-Resistenz) fiir den erfolgten Austausch der Gene 
in Pseudomonas sp. HR199 besteht, muBte ein anderes Selektionssystem zur 
Anwendung kommen. Bei dem "^ac5-Selektionssystem" wird das auszutauschende, 
durch Deletion inaktivierte Gen in einem Plasmid kloniert, welches neben einem 
5 Antibiotika-Resistenzgen auch uber das sacB-G^n verfligt. Nach konjugativer Uber- 
tragung dieses Hybridplasmids in einen Pseudomonaden wird das Plasmid durch 
homologe Rekombination an der Stelle in das Genom integriert, an der sich das 
intakte Gen befindet (erster "Cross over"). Auf diese Weise entsteht ein "heteroge- 
noter" Stamm, der sowohl iiber ein intaktes als auch iiber em durch Deletion inakti- 
0 viertes Gen verfiigt, welche durch die pHE55-DNA voneinander getrennt sind. Diese 
Stamme weisen die durch den Vektor codierte Resistenz auf und besitzen dariiber 
hinaus ein aktives ^ac^-Gen. Durch ein zweites homologes Rekombinationsereignis 
(zweiter "Cross over"), soli nun die pHE55-DNA zusammen mit dem intakten Gen 
aus der genomischen DNA ausgegliedert werden. Durch dieses Rekombinations- 
1 5 ereignis entsteht ein Stamm, der nur noch iiber das inaktivierte Gen verfugt. Daruber 

hinaus kommt es zum Verlust der pHE55-codierten Antibiotika-Resistenz und des 
sacB-GQXis, Streicht man Stamme auf Saccharose-haltigen Medien aus, werden 
Stamme die das sacB-Gcn exprimieren im Wachstum gehemmt, da das Genprodukt 
Saccharose zu einem Polymer xmisetzt, welches im Periplasma der Zellen 
20 akkumuliert wird. Zellen, die durch das zweite Rekombinationsereignis das sacB- 

Gen nicht mehr tragen, werden somit nicht im Wachstum gehemmt. Um eine 
phanotypische Selektionsmoglichkeit auf die Integration des durch Deletion inakti- 
vierten Gens zu besitzen, tauscht man dieses nicht gegen ein intaktes Gen aus, 
sondem man bedient sich eines Stammes, in dem das auszutauschende Gen bereits 
25 durch Insertion eines Q-Elements "markiert" vorliegt. Bei erfolgreichem Austausch 
verliert der resultierende Stamm die durch das Q-Element codierte Antibiotika- 
Resistenz. 

Das inaktivierte Gen fcsh. wurden nach P^rt-Verdauung aus dem Plasmid pSK/ci-A 
30 isoliert und mit Pstl geschnittener pHE55 DNA ligiert, Der Ligationsansatz wurde 

nach E. coli SI 7-1 transformiert. Die Selektion erfolgte auf Tetracyclin-haltigem LB- 
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Medium. Es wurden Tetracyclin-resistente Transformanden erhalten, deren Hybrid- 
plasmid (pHEfcsA) das inaktivierte Gen fcsA enthielt. 

Das inaktivierte Gen echA wurden nach £^coRI-Verdauung aus dem Plasmid 
5 pSKechA isoliert und mit Mung Bean Nuklease behandelt (Erzeugung von glatten 
Enden ["blunt ends"]). Das Fragment wurde mit BamHl geschnittener und Mung 
Bean Nuklease behandelter pHE55 DNA ligiert. Der Ligationsansatz wurde nach E. 
coli SI 7-1 transformiert. Die Selektion erfolgte auf Tetracyciin-haltigem LB- 
Medium. Es wurden Tetracyclin-resistente Transformanden erhalten, deren 
Hybridplasmid (pHEec/iA) das inaktivierte Gen echA enthielt. 

Das inaktivierte Gen vdhA wurden nach ^cc^RI-Verdauung aus dem Plasmid 
pSKv£//jA isoliert und mit Mung Bean Nuklease behandelt. Das Fragment wurde mit 
BamYil geschnittener und Mung Bean Nuklease behandelter pHE55 DNA ligiert. Der 
Ligationsansatz vmrde nach E, coli SI 7-1 transformiert. Die Selektion erfolgte auf 
Tetracyciin-haltigem LB-Medium, Es wurden Tetracyclin-resistente Transformanden 
erhalten, deren Hybridplasmid (pHEvc/AA) das inaktivierte Gen vdhA enthielt. 

Das inaktivierte Gen aatA v^den nach £coRI-Verdauung aus dem Plasmid 
pSKaa^A isoliert und mit Mung Bean Nuklease behandelt. Das Fragment wurde mit 
BamHl geschnittener und Mung Bean Nuklease behandelter pHE55 DNA ligiert. Der 
Ligationsansatz wurde nach E. coli SI 7-1 transformiert. Die Selektion erfolgte auf 
Tetracyciin-haltigem LB-Medium. Es wurden Tetracyclin-resistente Transformanden 
erhalten, deren Hybridplasmid (pHEaa^A)das inaktivierte Gen aatA enthielt. 




HR 199 



-27- 

Beispiel 6 

Erzeugung von Mutanten des Stamtnes Pseudomonas sp. HR199, bei denen 
spezifisch Gene des Eugenol-Katabolismuses durch Insertion eines Q-EIementes 
5 inaktiviert wurden. 

Der Stamm Pseudomonas sp. HR199 wurde als Rezipient in Konjugationsexperi- 
menten eingesetzt, bei denen Stamme von E. coli SI 7-1 als Donoren eingesetzt 
wurden, die die unten aufgefuhrten Hybridplasmi de von pSUP202 enthielten. Die 
Transkonjuganten wurden auf Gluconat-haltigem Mineralmedium selektiert, welches 
das dem Q-Element entsprechende Antibiotikum enthielt. "Homogenote" (Austausch 
des intakten Gens gegen das durch Q-Element-Insertion inaktivierte Gen durch 
doppeltes "Cross over") und "heterogenote" (Integration des Hybridplasmids in das 
Genom durch einfachen "Cross over") Transkonjuganten konnten anhand der durch 
pSUP202 codierten Tetracyclin-Resistenz unterschieden werden. 

Die Mutanten Pseudomonas sp. HR199 fcsOKm und Pseudomonas sp. HR199 fcsO. 
Gm wurden nach Konjugation von Pseudomonas sp. HR199 mit E. coli SI 7-1 
(pSUP/c^QKm) bzw. E. coli SI 7-1 (pSUP/c^QGm) erhalten. Der Austausch des 
intakten ^5-Gens gegen das durch QKm bzw. QGm inaktivierte Gen (fcsOKia bzw. 
fcsOGm) wurde mittels DNA-Sequenzierung verifiziert. 

Die Mutanten Pseudomonas sp. HR199 echQKm und Pseudomonas sp. HR199 echO, 
Gm wurden nach Konjugation von Pseudomonas sp. HR199 mit E. coli S17-1 
(pSUPecAQKm) bzw. E. coli SI 7-1 (pSUPec/zQGm) erhalten. Der Austausch des 
intakten ec/z-Gens gegen das durch QKm bzw. QGm inaktivierte Gen (ecAQKm 
bzw. echO.Gva) wurde mittels DNA-Sequenzierung verifiziert. 

Die Mutanten Pseudomonas sp. HR199 vdhQKm und Pseudomonas sp. HR199 vdh 
QG m wurden nach Konjugation von Pseudomonas sp. HR199 mit E. coli SI 7-1 
(pSUPvc/ZzQKm) bzw. E. coli SI 7-1 (pSUPvt/ZzQGm) erhalten. Der Austausch des 




15 



25 
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intakten vdh-G^ns gegen das durch QKm bzw. QGm inaktivierte Gen {vdhQKm 
bzw. vdhQ.Gm) wurde mittels DNA-Sequenzierung verifiziert. 

Die Mutanten Pseudomonas sp. HR199 aa/QKm und Pseudomonas sp. HR199 aa/Q 
5 Gm wurden nach Konjugation von Pseudomonas sp. HR199 mit E. coli SI 7-1 
(pSUPaarQKxn) bzw, E. coli SI 7-1 (pSUPaa/QGm) erhalten. Der Austausch des 
intakten aa^Gens gegen das durch QKxti bzw. QGm inaktivierte Gen {aatOKm bzw. 
aatOGm) vmrde mittels DNA-Sequenzierung verifiziert. 

^^^^^^^10 Die Mutante Pseudomonas sp. HR199 fcsQLKmvdhOGm wurden nach Konjugation 
^^^^P von Pseudomonas sp. HR199 fcsQKm mit E, coli SI 7-1 (pSUPvrf/zQGm) erhalten. 

Der Austausch des intakten vc/Zz-Gens gegen das durch QGm inaktivierte Gen (ydhO. 
Gm) wurde mittels DNA-Sequenzierung verifiziert. 

15 Die Mutante Pseudomonas sp. HR199 vdhOKmaatflGm wurden nach Konjugation 
von Pseudomonas sp. HR199 vdhDKsa mit E. coli SI 7-1 (pSUPaa/QGm) erhalten. 
Der Austausch des intakten aaf-G^ns gegen das durch QGm inaktivierte Gen (aatQ. 
Gm) wurde mittels DNA-Sequenzierung verifiziert. 

20 Die Mutante Pseudomonas sp. HR199 vdhQKmechClGm wurden nach Konjugation 
^^^^k von Pseudomonas sp. HR199 vdhQKm mit E, coli SI 7- 1 (pSUPec/zQGm) erhalten. 

^^^^ Der Austausch des intakten ec/z-Gens gegen das durch QGm inaktivierte Gen {echQ. 

Gm) wurde mittels DNA-Sequenzierung verifiziert. 
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Beispiel 7 

Erzeugung von Mutanten des Stammes Pseudomonas sp. HR199, bei denen 
spezifisch Gene des Eugenol-Katabolismuses durch Deletion eines Teilbereiches 
5 inaktiviert wurden. 

Die Stamme Pseudomonas sp. HR199 ^c^QKm, Pseudomonas sp. HR199 echOKsn, 
Pseudomonas sp. HR199 vdhDKm und Pseudomonas sp. HR199 aatOKm wurden 
als Rezipient in Konjugationsexperimenten eingesetzt, bei denen Stamm e von E. coli 
SI 7-1 als Donoren eingesetzt vmrden, die die unten aufgefuhrten Hybridplasmide 
^^^^^^10 von pHE55 enthielten. Die "heterogenoten" Transkonjuganten wurden auf Gluconat- 
^^^^V haltigem Mineralmedium selektiert, welches neben Tetracyclin (pHE55 codierte 

Resistenz) das dem Q-Element entsprechende Antibiotikum enthielt. Nach Ausstrei- 
chen auf Saccharose-haltigem Mineralmedium wurden Transkonjuganten erhalten, 
die durch ein zweites Rekombinationsereignis (zweiter "Cross over") die Vektor- 
15 DNA eliminiert hatten. Durch Ausstreichen auf Mineralmedium ohne Antibiotika 
bzw. mit dem Q-Element entsprechenden Antibiotikum konnten die Mutanten 
erkannt werden, bei denen das durch Q-Element inaktivierte Gen gegen das durch 
Deletion inaktivierte Gen ausgetauscht worden war (keine Antibiotika-Resistenz). 

20 Die Mutante Pseudomonas sp. HR199 ^fc^A wurde nach Konjugation von Pseudomo- 

^1^^^ nas sp. HR199/c^QKm mit E. coli SI 7-1 (pHE/c^A) erhalten. Der Austausch des 

^^^^ durch QKm inaktivierten Gens (/c^QKm) gegen das durch Deletion inaktivierte Gen 

(fcsA) wurde mittels DNA-Sequenzierung verifiziert. 

25 Die Mutanten Pseudomonas sp. HR199 ecAA wurde nach Konjugation von Pseudo- 

monas sp. HR199 echOKm mit E. coli SI 7-1 (pHEecM) erhalten. Der Austausch 
des durch QKm inaktivierten Gens (ec/zQKm) gegen das durch Deletion inaktivierte 
Gen (echA) wurde mittels DNA-Sequenzierung verifiziert. 
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Die Mutanten Pseudomonas sp. HR199 vc/M wurde nach Konjugation von Pseu- 
domonas sp. HR199 vdhQKm mit E, coli SI 7-1 (pHEvJ/zA) erhalten. Der Austausch 
des durch QKm inEiktivierten Gens (v^i/zQKm) gegen das durch Deletion inaktivierte 
Gen (ydhA) wurde mittels DNA-Sequenziemng verifiziert. 

5 

Die Mutanten Pseudomonas sp. HR199 aatA wurde nach Konjugation von Pseudo- 
monas sp. HR199 aatQKm mit E, coli SI 7-1 (pHEaatA) erhalten. Der Austausch des 
durch QKm inaktivierten Gens (aatQKm) gegen das durch Deletion inaktivierte Gen 
{aatA) wurde mittels DNA-Sequenzierung verifiziert. 

10 

Beispiel 8 

Biotransformation von Eugenol zu Vanillin mit der Mutante Pseudomonas sp. 
HR199 vrfAQKm. 

15 Der Stamm Pseudomonas sp. HR199 vdhQKm wurde in 50 ml HR-MM mit 6 mM 
Eugenol bis zu einer optischen Dichte von ca, OD600nm = 0,6 angezogen. Nach 17 h 
waren 2.9 mM Vanillin, L4 mM Ferulasaure und 0.4 mM Vanillinsaure im Kultur- 
iiberstand nachweisbar. 

20 Beispiel 9 

Biotransformation von Eugenol zu Ferulasaure mit der Mutante Pseudomonas 
sp. HR199 vrfAQGmaa/QKm. 

Der Stamm Pseudomonas sp. HR199 vdhClGmaatClKm wurde in 50 ml HR-MM mit 
25 6 mM Eugenol bis zu einer optischen Dichte von ca. OD600rLm ~ 0.6 angezogen. 

Nach 18 h waren 1.9 mM Vanillin, 2.4 mM Ferulasaure und 0.6 mM Vanillinsaure 
im Kulturiiberstand nachweisbar. 
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Beispiel 10 



Biotransformation von Eugenoi zu Coniferylalkohol mit der Mutante Pseudo- 
monas sp. HR199 vrf/rQGmaa/QKm. 

5 Der Stamm Pseudomonas sp. HR199 vdhQ^GmaatOKm wurde in 50 ml HR-MM mit 

6 mM Eugenoi bis zu einer optischen Dichte von ca. OD600nm = 0,4 angezogen. 
Nach 15 h waren 1.7 mM Coniferylalkohol, 1.4 mM Vanillin, 1.4 mM Ferulasaure 
und 0.2 mM Vanillinsaure im Kulturuberstand nachweisbar. 




Fermentative Produktion von natiirlichem Vanillin aus Eugenoi im 10 1 
Fermenter mit der Mutante Pseudomonas sp. HR 199 vrf/rQKM. 

Mit 100 ml einer 24 Stunden alten Vorkultur, die auf einer Schuttelmaschine (120 
15 Upm) bei 32°C in einem auf pH 7,0 eingestellten Medium aus 12,5 g/1 Glyzerin, 

10 g/1 Hefeextrakt und 0,37 g/1 Essigsaure angezogen wurde, wurde der Produktions- 
fermenter beimpft. Der Fermenter enthielt 9,9 1 Medium mit folgender Zusammen- 
setzung: 1,5 g/1 Hefeextrakt, 1,6 g/1 KH2PO4, 0,2 g/1 NaCl, 0,2 g/1 MgS04. Der pH- 
Wert wurde mit Natronlauge auf pH 7,0 eingestellt. Nach der Sterilisation wurde 
20 dem Medium 4 g Eugenoi zugefugt. Die Temperatur betrug 32°C, die Beluftung 3 
Nl/min und die Ruhrerdrehzahl 600 Upm. Der pH-Wert wurde mit Natronlauge bei 
pH 6,5 gehalten. 



Vier Stunden nach dem Animpfen wurde mit der kontinuierlichen Zugabe von 
25 Eugenoi begonnen, so daB am Ende der Fermentation nach 65 Stunden 255 g Euge- 
noi zur Kultur gegeben worden waren. AuBerdem wurden wahrend der Fermentation 
40 g Hefeextrakt zugefiittert. Die Konzentration an Eugenoi lag am Ende der Fer- 
mentation bei 0,2 g/1, Der Gehalt an Vanillin betrug 2,6 g/1. Zusatzlich lagen noch 
3,4 g/1 Ferulasaure vor. 



30 
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Das so erhaltene Vanillin kann durch bekannte physikalische Verfahren wie Chro- 
matographic, Destination und/oder Extraktion isoliert und zur Herstellung natiirlicher 
Aromen verwendet werden. 

5 Erlauterungen zu den Figuren: 

FIG. la bis Ir: 



Gen- Strukturen zur Gewinnung von Organismen und Mutanten 

10 

calA *: Teil des inaktivierten Gens der Coniferylalkohol-Dehydrogenase 
calB"^: Teil des inaktivierten Gens der Coniferylaldehyd-Dehydrogenase 
fcs*: Teil des inaktivierten Gens der Ferulasaure-CoA Synthetase 
ech^\ Teil des inaktivierten Gens der Enoyl-CoA Hydratase-Aldolase 
1 5 vdh"^: Teil des inaktivierten Gens der Vanillin-Dehydrogenase 
aa/*: Teil des inaktivierten Gens der beta-Ketothiolase 

Die mit versehenen Restriktionsenzym-Schnittstellen kamen fur die Konstruktion 
zum Einsatz, sind jedoch in dem resultierenden Konstrukt nicht mehr funktionsfahig. 

20 
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FIG. 2a: Nukleotidsequenz der Gen-Struktur calAQKm 
FIG. 2b: Nukleotidsequenz der Gen-Struktur calAOGm: 
FIG. 2c: Nukleotidsequenz der Gen-Struktur calAA 
FIG. 2d: Nukleotidsequenz der Gen-Struktur calBQKm 
FIG. 2e: Nukleotidsequenz der Gen-Struktur calBQ.Gm 
FIG. 2f: Nukleotidsequenz der Gen-Struktur calBA 
FIG. 2g: Nukleotidsequenz der Gen-Struktur /c^-QKm 
FIG. 2h: Nukleotidsequenz der Gen-Struktur /c^QGm 
FIG. 2i: Nukleotidsequenz der Gen-Struktur /c5' A 
FIG. 2j: Nukleotidsequenz der Gen-Struktur echOKm 
FIG. 2k: Nukleotidsequenz der Gen-Struktur echOGm 
FIG. 21: Nukleotidsequenz der Gen-Struktur echA 
FIG. 2m: Nukleotidsequenz der Gen-Struktur vdhQKm 
FIG. 2n: Nukleotidsequenz der Gen-Struktur vdhO,Gm 
FIG. 2o: Nukleotidsequenz der Gen-Struktur vdtiA 
FIG. 2p: Nukleotidsequenz der Gen-Struktur aatQKm 
FIG. 2q: Nukleotidsequenz der Gen-Struktur aatOGm 
FIG. 2r: Nukleotidsequenz der Gen-Struktur aatA 
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Sequenzen 

CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 

GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 

GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 

CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 24 0 

AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 

GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA 360 

TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 20 



AAAGAGCATG CAA CTG ACC AAC AAG AAA ATC GTC GTC AGO GGA GTG TCC TCC 4 72 
Met Gin Leu Thr Asn Lys Lys lie Val Val Thr Gly Val Ser Ser 
15 10 15 




GT ATC GGT GCC GAA ACT GCC CGC GTT CTG CGC TCT CAC GGC GCC ACA 520 
ly lie Gly Ala Glu Thr Ala Arg Val Leu Arg Ser His Gly Ala Thr 
20 25 30 

GTG ATT GGC GTA GAT CGC AAC ATG CCG AGC CTG ACT CTG GAT GCT TTC 568 
Val lie Gly Val Asp Arg Asn Met Pro Ser Leu Thr Leu Asp Ala Phe 
35 40 45 

GTT CAG GCT GAC CTG AGC CAT CCT GAA GGC ATC GAT AAG GCC ATC GGG 616 
Val Gin Ala Asp Leu Ser His Pro Glu Gly lie Asp Lys Ala lie 
50 55 60 62 

ACAGCAAGCG AACCGGAATT GCCAGCTGGG GCGCCCTCTG GTAAGGTTGG GAAGCCCTGC 67 6 

AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGGATCTGAT GGCGCAGGGG ATCAAGATCT 736 

GATCAAGAGA CAGGATGAGG ATCGTTTCGC ATG ATT GAA CAA GAT GGA TTG CAC 7 90 

Met lie Glu Gin Asp Gly Leu His 
1 5 

CA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC TGG 838 
'Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp Trp 
10 15 20 

GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG TCA 886 
Ala Gin Gin Thr lie Gly Cys Ser Asp Ala Ala Val Phe Arg Leu Ser 
25 30 35 40 

GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT GCC 934 
Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly Ala 
45 50 55 

CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC ACG 982 
Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala Thr 
60 65 70 
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ACG GGC GTT CCT TGC GCA GCT GTG CTC GAG GTT GTC ACT GAA GCG GGA 1030 
Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val Thr Glu Ala Gly 
75 80 85 

AGG GAG TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG TCA 107 8 

Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin Asp Leu Leu Ser 
90 95 100 

TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA ATG 112 6 

Ser His Leu Ala Pro Ala Glu Lys Val Ser lie Met Ala Asp Ala Met 
105 110 115 120 

CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC CAA 117 4 

Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His Gin 
1 130 135 



GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT CTT 1222 
Ala Lys His Arg lie Glu Arg Ala Arg Thr Arg Met Glu Ala Gly Leu 
140 145 150 




TC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA GCC 127 0 

Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly Leu Ala Pro Ala 
155 160 165 

GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT CTC 1318 

Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp Leu 

170 175 180 

GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA AAT 1366 

Val Val Thr His Gly Asp Ala Cys Leu Pro Asn lie Met Val Glu Asn 
185 190 195 200 

GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG GAC 1414 

Gly Arg Phe Ser Gly Phe lie Asp Cys Gly Arg Leu Gly Val Ala Asp 
205 210 215 

CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG CTT 14 62 

Arg Tyr Gin Asp He Ala Leu Ala Thr Arg Asp He Ala Glu Glu Leu 
220 225 230 

'GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC GCT 1510 

Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly He Ala Ala 
235 240 245 

CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC TTC 1558 

Pro Asp Ser Gin Arg He Ala Phe Tyr Arg Leu Leu Asp Glu Phe Phe 

250 255 260 264 

TGAGCGGGAC TCTGGGGTTC GAAATGACCG ACCAAGCGAC GCCCTG GCC GCG GTG 1613 

Ala Ala Val 
225 

ATT GCA TTC ATG TGT GCT GAG GAG TCA CGT TGG ATC AAC GGC ATA AAT 1661 

He Ala Phe Met Cys Ala Glu Glu Ser Arg Trp He Asn Gly He Asn 

230 _ _ 235 240 
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ATT CCA GTG GAC GGA GGT TTG GCA TCG ACC TAG GTG TAA GTTCGTGGAC 1710 
He Pro Val Asp Gly Gly Leu Ala Ser Thr Tyr Val 
245 250 255 

GCCCTTTGCA CGCGCACTAT ATCTCTATGC AGCAGCTGAA AGCAGCTTTG GTTTTGATCG 1770 

GAGGTAGCGG GCGGAAAGGT GCAGAATGTC TAAATAATAA AGGATTCTTG TGAAGCTTTA 1830 

GTTGTCCGTA AACGAAAATA AAAATAAAGA GGAATGATAT GAAAGCAAGT AGATCAGTCT 18 90 

GCACTTTCAA AATAGCTACC CTGGCAGGCG CCATTTATGC AGCGCTGCCA ATGTCAGCTG 1950 

CAAACTCGAT GCAGCTGGAT GTAGGTAGCT CGGATTGGAC GGTGCGTTGG GGACAACACC 2010 

CTCAAGTATA GCrTTGCrTr TrnrrTHAAT aAGCAAGACr CAAGTCTGAC AAATGCGCCG 2070 

^ ACTGTCAATG GTTATATCCG GATATTCAAA GTCAGGGTGA TCGTAACTTT GACCGGGGGC 2130 

^JI^^^MTGGTATCCA ATCGTCTCGA TATTCTGGCT GCAG 2164 

^^^^FIG. 
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CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 

GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 

GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 

CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 24 0 

AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 

GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA 360 

TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 20 

AAftGAGPfiTr: rz^a rm 7\r.r tx ac AAH AA A ATC GTC GTC ACC GGA GT G TCC TCC 4 72 
Met Gin Leu Thr Asn Lys Lys lie Val V ai I'hr Liy \Ial ^er JbJer 
15 10 15 

GT ATC GGT GCC GAA ACT GCC CGC GTT CTG CGC TCT CAC GGC GCC ACA 520 
ly lie Gly Ala Glu Thr Ala Arg Val Leu Arg Ser His Gly Ala Thr 
20 25 30 



GTG ATT GGC GTA GAT CGC AAC ATG CCG AGC CTG ACT CTG GAT GCT TTC 
Val lie Gly Val Asp Arg Asn Met Pro Ser Leu Thr Leu Asp Ala Phe 
35 40 45 



568 



GTT CAG GCT GAC CTG AGC CAT CCT GAGGGGAGAG GCGGTTTGCG TATTGGGCGC 622 
Val Gin Ala Asp Leu Ser His Pro 
50 55 

ATGCATAAAA ACTGTTGTAA TTCATTAAGC ATTCTGCCGA CATGGAAGCC ATCACAAACG 682 

GCATGATGAA CCTGAATCGC CAGCGGCATC AGCACCTTGT CGCCTTGCGT ATAATATTTG 742 

CCCATGGACG CACACCGTGG AAACGGATGA AGGCACGAAC CCAGTTGACA TAAGCCTGTT 802 

CGGTTCGTAA ACTGTAATGC AAGTAGCGTA TGCGCTCACG CAACTGGTCC AGAACCTTGA 8 62 

CCGAACGCAG CGGTGGTAAC GGCGCAGTGG CGGTTTTCAT GGCTTGTTAT GACTGTTTTT 922 

TTGTACAGTC TATGCCTCGG GCATCCAAGC AGCAAGCGCG TTACGCCGTG GGTCGATGTT 982 

TGATGTTATG GAGCAGCAAC G ATG TTA CGC AGC AGC AAC GAT GTT ACG CAG 1033 

Met Leu Arg Ser Ser Asn Asp Val Thr Gin 
15 10 

CAG GGC AGT CGC CCT AAA ACA AAG TTA GGT GGC TCA AGT ATG GGC ATC 1081 

Gin Glv Sf»r Am Pr-o T.\7c: Th-r T.\7c T.on r:^ xr rzi XT Cc>-»- C^^-k- KA^^- /-I,, Tl^ 
J - — ~f — J— — ^^w-. J i^^j^ L jv^ ^_ \j J- y JL -1. c 

15 20 25 

ATT CGC ACA TGT AGG CTC GGC CCT GAC CAA GTC AAA TCC ATG CGG GCT 112 9 

lie Arg Thr Cys Arg Leu Gly Pro Asp Gin Val Lys Ser Met Arg Ala 
30 35 40 

GCT CTT GAT CTT_TTC_GGT CGT GAG TTC GGA GAC GTA GCC ACC TAG TCC 1177 
Ala Leu Asp Leu Phe Gly Arg Glu Phe Gly Asp Val Ala Thr Tyr Ser 
45 50 55 
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CAA CAT CAG CCG GAG TCC GAT TAG CTC GGG AAC TTG CTC CGT AGT AAG 1225 

Gin His Gin Pro Asp Ser Asp Tyr Leu Gly Asn Leu Leu Arg Ser Lys 
60 65 70 

ACA TTG ATC GCG CTT GCT GCC TTC GAG CAA GAA GCG GTT GTT GGC GCT 127 3 

Thr Phe lie Ala Leu Ala Ala Phe Asp Gin Glu Ala Val Val Gly Ala 
75 80 85 90 

CTC GCG GCT TAG GTT CTG CCC AGG TTT GAG CAG CCG CGT AGT GAG ATC 1321 

Leu Ala Ala Tyr Val Leu Pro Arg Phe Glu Gin Pro Arg Ser Glu He 
95 100 105 

TAT ATC TAT GAT CTC GCA GTC TCC GGC GAG CAG CGG AGG CAG GGC ATT 1369 

Tyr He Tyr Asp Leu Ala Val Ser Gly Glu His Arg Arg Gin Gly lie 

110 Li5 120 



GCC ACC GCG CTC ATC AAT CTC CTC AAG CAT GAG GCC AAC GCG CTT GGT 1417 
/Via Thr Ala Leu He Asn Leu Leu Lys His Glu Ala Asn Ala Leu Gly 
125 130 135 



CT TAT GTG ATC TAG GTG CAA GCA GAT TAG GGT GAG GAT CCC GCA GTG 14 65 

Ala Tyr Val He Tyr Val Gin Ala Asp Tyr Gly Asp Asp Pro Ala Val 
140 145 150 

GCT CTC TAT ACA AAG TTG GGC ATA CGG GAA GAA GTG ATG CAC TTT GAT 1513 
Ala Leu Tyr Thr Lys. Leu Gly He Arg Glu Glu Val Met His Phe Asp 
155 160 165 170 

ATC GAC CCA AGT ACC GCC ACC TAA CAATTCGTTC AAGCCGAGAT CGGCTTCCCT 1567 
He Asp Pro Ser Thr Ala Thr 
175 177 

G ATT GCA TTC ATG TGT GCT GAG GAG TCA CGT TGG ATC AAC GGC ATA AAT 1616 
He Ala Phe Met Cys Ala Glu Glu Ser Arg Trp He Asn Gly He Asn 
228 230 235 240 



ATT CCA GTG GAC GGA GGT TTG GCA TCG ACC TAG GTG TAA GTTCGTGGAC 1665 
He Pro Val Asp Gly Gly Leu Ala Ser Thr Tyr Val 
245 250 255 



CCCTTTGCA CGCGCACTAT ATCTCTATGC AGCAGCTGAA AGCAGCTTTG GTTTTGATCG 1725 

GAGGTAGCGG GCGGAAAGGT GCAGAATGTC TAAATAATAA AGGATTCTTG TGAAGCTTTA 1785 

GTTGTCCGTA AACGAAAATA AAAATAAAGA GGAATGATAT GAAAGCAAGT AGATCAGTCT 184 5 

GCACTTTCAA AATAGCTACC CTGGCAGGCG CCATTTATGC AGCGCTGCCA ATGTCAGCTG 1905 

CAAACTCGAT GCAGCTGGAT GTAGGTAGCT CGGATTGGAC GGTGCGTTGG GGACAACACC 19 65 

CTCAAGTATA GCCTTGCCTC TCGCCTGAAT GAGCAAGACT CAAGTCTGAC AAATGCGCCG 2025 

ACTGTCAATG GTTATATCCG GATATTCAAA GTCAGGGTGA TCGTAACTTT GACCGGGGGC 208 5 

TTGGTATCCA ATCGTCTCGA TATTCTGGCT GCAG 2119 



FIG. 2b: 
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CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 

GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 

GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 

CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 24 0 

AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 

GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA 360 

TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 20 



AAAGAnCATG CAA CTG ACC AAr aan AAA ATC GTC GTC ACC GGA GTG TCC TCC 4 72 

Met Gin Leu Thr Asn Lys Lys lie Vai Vai Thr fiiy Vai ^er !^er 

15 10 15 



GT ATC GGT GCC GAA ACT GCC CGC GTT CTG CGC TCT CAC GGC GCC ACA 520 
ly lie Gly Ala Glu Thr Ala Arg Vai Leu Arg Ser His Gly Ala Thr 
20 25 30 



GTG ATT GGC GTA GAT CGC AAC ATG CCG AGC CTG ACT CTG GAT GCT TTC 568 
Vai lie Gly Vai Asp Arg Asn Met Pro Ser Leu Thr Leu Asp Ala Phe 
35 40 45 

GTT CAG GCT GAC CTG AGC CAT CCT GAA GGC ATC GATC AAC GGC ATA AAT 617 
Vai Gin Ala Asp Leu Ser His Pro Glu Gly lie Asn Gly lie Asn 

50 55 58 240 

ATT CCA GTG GAC GGA GGT TTG GCA TCG ACC TAC GTG TAA GTTCGTGGAC 666 
lie Pro Vai Asp Gly Gly Leu Ala Ser Thr Tyr Vai 
245 250 255 

GCCCTTTGCA CGCGCACTAT ATCTCTATGC AGCAGCTGAA AGCAGCTTTG GTTTTGATCG 72 6 

GAGGTAGCGG GCGGAAAGGT GCAGAATGTC TAAATAATAA AGGATTCTTG TGAAGCTTTA 78 6 

GTTGTCCGTA AACGAAAATA AAAATAAAGA GGAATGATAT GAAAGCAAGT AGATCAGTCT 84 6 

GCACTTTCAA AATAGCTACC CTGGCAGGCG CCATTTATGC AGCGCTGCCA ATGTCAGCTG 906 

CAAACTCGAT GCAGCTGGAT GTAGGTAGCT CGGATTGGAC GGTGCGTTGG GGACAACACC 966 

CTCAAGTATA GCCTTGCCTC TCGCCTGAAT GAGCAAGACT CAAGTCTGAC AAATGCGCCG 1026 

ACTGTCAATG GTTATATCCG GATATTCAAA GTCAGGGTGA TCGTAACTTT GACCGGGGGC 108 6 

TTGGTATCCA ATCGTCTCGA TATTCTGGCT GCAG 1120 



FIG, 2c: 
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GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 

GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 

TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 

TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 24 0 

GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGT^GCGAT GCTCCACTAC 300 

CGATTAAGAT 7U\TTA7VAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360 

CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 420 



Met Ser lie Leu Gly Leu Asn 
1 5 

GT GCC CCG GTC GGA GCT GAG GAG CTG GGC TCG GOT CTT GAT CGC ATG 521 
ly Ala Pro Val Gly Ala Glu Gin Leu Gly Ser Ala Leu Asp Arg Met 
10 15 20 



AAG AAG GOG CAC CTG GAG GAG GGG OCT GCA AAC TTG GAG CTG CGT CTG 569 
Lys Lys Ala His Leu Glu Gin Gly Pro Ala Asn Leu Glu Leu Arg Leu 
25 30 35 

AGT AGG CTG GAT CGT GCG ATT GCA ATG CTT CTG GAA AAT CGT GAa' GCA 617 
Ser Arg Leu Asp Arg Ala lie Ala Met Leu Leu Glu Asn Arg Glu Ala 
40 45 50 55 

ATT GCC GAC GCG GTT TCT GCT GAC TTT GGC AAT CGC AGC CGT GAG CAA 665 
lie Ala Asp Ala Val Ser Ala Asp Phe Gly Asn Arg Ser Arg Glu Gin 
60 65 70 

ACA CTG CTT TGC GAC ATT GCT GGC TCG GTG GCA AGC CTG AAG GAT AGC 713 
Thr Leu Leu Cys Asp lie Ala Gly Ser Val Ala Ser Leu Lys Asp Ser 
75 80 85 



CGC GAG CAC GTG GCC AAA TGG ATG GAG CCC GAA CAT CAC AAG GCG ATG 7 61 

rg Glu His Val Ala Lys Trp Met Glu Pro Glu His His Lys Ala Met 
90 95 100 



TTT CCA GGG GCG GAG GCA CGC GTT GAG TTT CAG CCG CTG GGT GTC GTT 809 
Phe Pro Gly Ala Glu Ala Arg Val Glu Phe Gin Pro Leu Gly Val Val 
105 110 115 

GGG GTC ATT AGT CCC TGG AAC TTC OCT ATC GTA CTG GCC TTT GGG CCG 857 
Gly Val lie Ser Pro Trp Asn Phe Pro lie Val Leu Ala Phe Gly Pro 
120 125 130 135 

CTG GCC GGC ATA TTC GCA GCA GGT AAT CGC GCC ATG CTC AAG CCG TCC 905 
Leu Ala Gly lie Phe Ala Ala Gly Asn Arg Ala Met Leu Lys Pro Ser 
140 145 150 

GAG CTT ACC GGG- CGG-ACT TCT GCC CTG CTT GCG GAG GTA ATT GCT CGT - 953 

Glu Leu Thr Pro Arg Thr Ser Ala Leu Leu Ala Glu Leu lie Ala Arg 
155 160 165 
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TAG TTC GAT GAA ACT GAG CTG ACT ACA GTG CTG GGC GAC GCT GAA GTC 
Tyr Phe Asp Glu Thr Glu Leu Thr Thr Val Leu Gly Asp Ala Glu Val 
170 175 180 



1001 



GGT GCG CTG TTC AGT GCT CAG CCT TTC GAT CAT CTG ATC TTC ACC GGC 
Gly Ala Leu Phe Ser Ala Gin Pro Phe Asp His Leu lie Phe Thr Gly 
185 190 195 



1049 



GGC ACT GCC GTG GCC AAG CAC ATC ATG CGT GCC GCG GCG GAT AAC CTA 
Gly Thr Ala Val Ala Lys His lie Met Arg Ala Ala Ala Asp Asn Leu 
200 205 210 215 



1097 



GTG CCC GTT ACC CTG GAA TTG GGT GGC AAA TCG CCG GTG ATC GTT TCC 
Val Pro Val Thr Leu Glu Leu Gly Gly Lys Ser Pro Val lie Val Ser 



1145 



CGC AGT GCA GAT ATG GCG GAC GTT GCA CAA CGG GTG TTG ACG GTG AAA 1193 

Arg Ser Ala Asp Met Ala Asp Val Ala Gin Arg Val Leu Thr Val Lys 

235 240 245 

ACC TTC AAT GCC GGG CAA ATC TGT CTG GCA CCG GAC TAT GTG CTG CTG 12 41 

Thr Phe Asn Ala Gly Gin lie Cys Leu Ala Pro Asp Tyr Val Leu Leu 

250 255 260 



CCG GAA GGGACAGCAA GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT 
Pro Glu 
265 



1297 



TGGGAAGCCC TGCAAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GATGGCGCAG 1357 

GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGC ATG ATT GAA CAA 1412 

Met He Glu Gin 
1 



GAT GGA TTG CAC GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC 14 60 

Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe 

5 10 15 20 

GGC TAT GAC TGG GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG 1508 

Gly Tyr Asp Trp Ala Gin Gin Thr He Gly Cys Ser Asp Ala Ala Val 

25 30 35 

TTC CGG CTG TCA GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC 1556 

Phe Arg Leu Ser Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp 

40 45 50 



CTG TCC GGT GCC CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG 
Leu Ser Gly Ala Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser 
55 60 65 



TGG CTG GCC ACG ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC 
Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val 
70 75 80 



1652 
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ACT GAA GCG GGA AGG GAG TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG 
Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin 
85 90 95 100 



1700 



GAT CTC CTG TCA TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG 
Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys Val Ser lie Met 
105 110 115 



1748 



GCT GAT GCA ATG CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA 
Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro 
120 125 130 



1796 



TTC GAC 
Phe Asp 



CAC CAA 
His Gin 
135 



GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG 
Ala Lys His Arg lie Glu Arg Ala Arg Thr Arg Met 



1844 




GAA GCC 
Glu Ala 
150 

tTC GCG 
Leu Ala 
165 



GGT CTT GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG 18 92 

Gly Leu Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly 
155 160 

CCA GCC GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC 194 0 

Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp 

170 175 180 



GGC GAG GAT CTC GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC 
Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys Leu Pro Asn lie 
185 190 195 



1988 



ATG GTG GAA AAT GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG 
Met Val Glu Asn Gly Arg Phe Ser Gly Phe lie Asp Cys Gly Arg Leu 
200 205 210 



2036 



GGT GTG GCG GAC CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT 
Gly Val Ala Asp Arg Tyr Gin Asp lie Ala Leu Ala Thr Arg Asp lie 
215 220 225 



2084 




GCT GAA 
Ala Glu 
230 

'GGT ATC 
Gly lie 
245 



GAG CTT GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAG 2132 

Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr 
235 240 

GCC GCT CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT 218 0 

Ala Ala Pro Asp Ser Gin Arg lie Ala Phe Tyr Arg Leu Leu 

250 255 260 



GAC GAG 
Asp Glu 



TTC TTC 
Phe Phe 
264 



TGA GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC 



2235 



CGC CAT GCC AAG CCT GTT CTC GTG CAA AGT CCT GTG GGT GAG TCG AAC 
His Ala Lys Pro Val Leu Val Gin Ser Pro Val Gly Glu Ser Asn 
444 445 450 455 



2283 



TTG GCG ATG CGC GCA CCC TAG GGA GAA GCG ATC CAC GGA CTG CTC TCT 
Leu Ala Met Arg Ala Pro Tyr Gly Glu Ala lie His Gly Leu Leu Ser 
460 -- 465 470 



2331 
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GTC CTC CTT TCA ACG GAG TGT TAG AACCGTTGGT AGTGGTTTTG GACGGGCCCA 2385 
Val Leu Leu Ser Thr Glu Cys 
475 480 481 

GGAGCATGCG CTTCTGGGCC CGTTTCTTGA GTATTCATTG GATAGTCACG CGTGGTAGCT 24 45 

TCGAGCCTGC ACAGCTGATG AGCACCCTGG AAGGCGCGCT GTACGCGGAC GACTGGGTTC 2505 

ATCTTCGCCA TTCATGACGG AACTCCGTTC CCCAGTACCG CGATGACTAT TTTGCCTCTT 2 565 

CCGATGTCCG ATTCCACGCC GCCTGACGCT AAGCGGGGGC GGGGGCGCCC GCATCCCAGC 2 625 

CCAGACAGCA ACAAATGAGT AGGCTCTTGG ATGCCGCGGC GGCTGAGATT GGTAACGGCA 2 685 

PiTTTrnTraa .TnTnarnnrn; nsTTrrATTi^ rrrfi ^ TnrTGa.^rGGcaTCTCi^ j\j\ni\j\T\A(;cc 



TGTACGTCTT GGTGGCGAGC AAGGAAGAAC TCATTTCCCG GTTAGTGGCT CGAGACATGT 
fccAACCTTGA GGAATTC 
FIG, 2d: 



2805 
2822 
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GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 

GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 

TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 

TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 24 0 

GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300 

CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360 

CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 4 20 

■ACAATAACAJ ; ^ '^'-T^rtt^'TejCTC ACJOAGCTGJiiG^ ■(^<j^A'i"G AUO Am' UTT OU'l' TTU AAT ■ 4''7^3 = 

Met Ser lie Leu Gly Leu Asn 

1 5 

iGT GCC CCG GTC GGA GOT GAG GAG CTG GGC TCG GCT CTT GAT CGC ATG 521 

ly Ala Pro Val Gly Ala Glu Gin Leu Gly Ser Ala Leu Asp Arg Met 

10 15 20 

AAG AAG GCG CAC CTG GAG GAG GGG COT GGA AAC TTG GAG CTG CGT CTG 5 69 

Lys Lys Ala His Leu Glu Gin Gly Pro Ala Asn Leu Glu Leu Arg Leu 
25 30 35 

AGT AGG CTG GAT CGT GCG ATT GGA ATG CTT CTG GAA AAT CGT GAA GCA 617 
Ser Arg Leu Asp Arg Ala lie Ala Met Leu Leu Glu Asn Arg Glu Ala 
40 45 50 55 

ATT GCC GAC GCG GTT TCT GCT GAG TTT GGC AAT CGC AGG CGT GAG CAA 665 
lie Ala Asp Ala Val Ser Ala Asp Phe Gly Asn Arg Ser Arg Glu Gin 
60 65 70 

ACA CTG CTT TGC GAC ATT GCT GGC TCG GTG GCA AGC CTG AAG GAT AGC 713 
Thr Leu Leu Cys Asp lie Ala Gly Ser Val Ala Ser Leu Lys Asp Ser 
75 80 85 

,CGC GAG CAC GTG GCC AAA TGG ATG GAG CCC GAA CAT CAC AAG GCG ATG 7 61 

rg Glu His Val Ala Lys Trp Met Glu Pro Glu His His Lys Ala Met 
90 95 100 

TTT CCA GGG GCG GAG GCA CGC GTT GAG TTT GAG CCG CTG GGT GTC GTT 809 
Phe Pro Gly Ala Glu Ala Arg Val Glu Phe Gin Pro Leu Gly Val Val 
105 110 115 

GGG GTC ATT AGT CCC TGG AAC TTC CCT ATC GTA CTG GCC TTT GGG CCG 8 57 

Gly Val lie Ser Pro Trp Asn Phe Pro He Val Leu Ala Phe Gly Pro 
120 125 130 135 

CTG GCC GGC ATA TTC GCA GCA GGT PJKT CGC GCC ATG GTC AAG CCG TCC 905 
Leu Ala Gly He Phe Ala Ala Gly Asn Arg Ala Met Leu Lys Pro Ser 
140 145 150 

GAG CTT ACC CCG^ CGG— ACT TCT GCC CTG CTT GCG GAG CTA ATT GCT CGT 953 

Glu Leu Thr Pro Arg Thr Ser Ala Leu Leu Ala Glu Leu He Ala Arg 
155 160 165 
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TAC TTC GAT GAA ACT GAG CTG ACT AC A GTG CTG GGC GAC GCT GAA GTC 1001 
Tyr Phe Asp Glu Thr Glu Leu Thr Thr Val Leu Gly Asp Ala Glu Val 
170 175 180 

GGT GCG CTG TTC AGT GCT CAG CCT TTC GAT CAT CTG ATC TTC ACC GGC 104 9 

Gly Ala Leu Phe Ser Ala Gin Pro Phe Asp His Leu lie Phe Thr Gly 
185 190 195 

GGC ACT GCC GTG GCC AAG CAC ATC ATG CGT GCC GCG GCG GAT AAC CTA 1097 
Gly Thr Ala Val Ala Lys His lie Met Arg Ala Ala Ala Asp Asn Leu 
200 205 210 215 

GTG CCC GTT ACC CTG GAA TTG GGT GGC AAA TCG CCG GTG ATC GTT TCC 114 5 

Val Pro Val Thr Leu Glu Leu Gly Gly Lys Ser Pro Val He Val Ser 
d.ilu r Ij£i5 ,. ujv 

CGC AGT GCA GAT ATG GCG GAC GTT GCA CAA CGG GTG TTG ACG GTG AAA 1193 
Arg Ser Ala Asp Met Ala Asp Val Ala Gin Arg Val Leu Thr Val Lys 
235 240 245 

ACC TTC AAT GCC GGG CAA ATC TGT CTG GCA CCG GAC TAT GTG CTG GGG 1241 
Thr Phe Asn Ala Gly Gin He Cys Leu Ala Pro Asp Tyr Val Leu 
250 255 260 262 

GAGAGGCGGT TTGCGTATTG GGCGCATGCA TAAAAACTGT TGTAATTCAT TAAGCATTCT 1301 

GCCGACATGG AAGCCATCAC AAACGGCATG ATGAACCTGA ATCGCCAGCG GCATCAGCAC 1361 

CTTGTCGCCT TGCGTATAAT ATTTGCCCAT GGACGCACAC CGTGGAAACG GATGAAGGCA 1421 

CGAACCCAGT TGACATAAGC CTGTTCGGTT CGTAAACTGT AATGCAAGTA GCGTATGCGC 14 81 

TCACGCAACT GGTCCAGAAC CTTGACCGAA CGCAGCGGTG GTAACGGCGC AGTGGCGGTT 1541 

TTCATGGCTT GTTATGACTG TTTTTTTGTA CAGTCTATGC CTCGGGCATC CAAGCAGCAA 1601 

GCGCGTTACG CCGTGGGTCG ATGTTTGATG TTATGGAGCA GCAACG ATG TTA CGC 1656 

Met Leu Arg 
1 

AGC AGC AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA ACA AAG TTA 1704 
Ser Ser Asn Asp Val Thr Gin Gin Gly Ser Arg Pro Lys Thr Lys Leu 
5 10 15 

GGT GGC TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC GGC CCT GAC 17 52 

Gly Gly Ser Ser Met Gly He He Arg Thr Cys Arg Leu Gly Pro Asp 
20 25 30 35 

CAA GTC AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT CGT GAG TTC 18 00 

Gin Val Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly Arg Glu Phe 
40 45 50 

GGA GAC GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC GAT TAG CTC 18 4 8 

Gly Asp Val Ala Thr Tyr Ser Gin His Gin Pro Asp Ser Asp Tyr Leu 

-5-5 -&0 — 65 - 

GGG AAC TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT GCC TTC GAC 18 96 

Gly Asn Leu Leu Arg Ser Lys Thr Phe He Ala Leu Ala Ala Phe Asp 
70 75 80 
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CAA GAA GCG GTT GTT GGC GCT CTC GCG GCT TAG GTT CTG CCC AGG TTT 194 4 

Gin Glu Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu Pro Arg Phe 
85 90 95 

GAG CAG CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA GTC TCC GGC 1992 
Glu Gin Pro Arg Ser Glu lie Tyr lie Tyr Asp Leu Ala Val Ser Gly 
100 105 110 115 

GAG CAG CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT CTC CTC AAG 204 0 

Glu His Arg Arg Gin Gly lie Ala Thr Ala Leu lie Asn Leu Leu Lys 
120 125 130 

CAT GAG GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG CAA GCA GAT 2088 
His Glu Ala Asn Ala Leu Gly Ala Tyr Val lie Tyr Val Gin Ala Asp 
1:^5 1 4 0 . 145 

TAC GGT GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG GGC ATA CGG 2136 
jTyr Gly Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu Gly lie Arg 
150 155 160 

feAA GAA GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC ACC TAA CAA 2184 
Glu Glu Val Met His Phe Asp lie Asp Pro Ser Thr Ala Thr 
165 170 175 177 

TTCGTTCAAG CCGAGATCGG CTTCCCTG CAA AGT CCT GTG GGT GAG TCG AAC 2236 

Gin Ser Pro Val Gly Glu Ser Asn 
451 455 

TTG GCG ATG CGC GCA CCC TAC GGA GAA GCG ATC CAC GGA CTG CTC TCT 2284 
Leu Ala Met Arg Ala Pro Tyr Gly Glu Ala He His Gly Leu Leu Ser 
460 465 470 

GTC CTC CTT TCA ACG GAG TGT TAG AACCGTTGGT AGTGGTTTTG GACGGGCCCA 2338 
Val Leu Leu Ser Thr Glu Cys 
475 480 481 

GGAGCATGCG CTTCTGGGCC CGTTTCTTGA GTATTCATTG GATAGTCACG CGTGGTAGCT 2398 

TCGAGCCTGC ACAGCTGATG AGCACCCTGG AAGGCGCGCT GTACGCGGAC GACTGGGTTC 24 58 

ATCTTCGCCA TTCATGACGG AACTCCGTTC CCCAGTACCG CGATGACTAT TTTGCCTCTT 2518 

CCGATGTCCG ATTCCACGCC GCCTGACGCT AAGCGGGGGC GGGGGCGCCC GCATCCCAGC 257 8 

CCAGACAGCA ACAAATGAGT AGGCTCTTGG ATGCCGCGGC GGCTGAGATT GGTAACGGCA 2 638 

ATTTCGTCAA TGTGACGATG GATTCGATTG CCCGTGCTGC CGGCGTCTCA AAAAAAACGC 2 698 

TGTACGTCTT GGTGGCGAGC AAGGAAGAAC TCATTTCCCG GTTAGTGGCT CGAGACATGT 2758 

CCAACCTTGA GGAATTC 277 5 



FIG. 2e: 
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GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 

GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 

TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 

TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 24 0 

GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300 

CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360 

CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 420 




GT GCC 
ly Ala 



CCG 
Pro 
10 



GTC GGA 
Val Gly 



GOT GAG GAG CTG 
Ala Glu Gin Leu 
15 



Met 
1 

GGC 
Gly 



Ser 



TCG 
Ser 



lie Leu Gly 
5 

GOT CTT GAT 
Ala Leu Asp 
20 



Leu Asn 



GGC ATG 
Arg Met 



521 



AAG AAG GCG CAC CTG GAG GAG GGG CCT GCA AAC TTG GAG CTG CGT CTG 
Lys Lys Ala His Leu Glu Gin Gly Pro Ala Asn Leu Glu Leu Arg Leu 
25 30 35 



569 



AGT AGG CTG GAT CGT GCG ATT GCA ATG CTT CTG GAA AAT CGT GAA GCA 
Ser Arg Leu Asp Arg Ala He Ala Met Leu Leu Glu Asn Arg Glu Ala 
40 45 50 55 



617 



ATT GCC 
He Ala 



GAG 
Asp 



GCG GTT 
Ala Val 
60 



TCT GCT GAG TTT 
Ser Ala Asp Phe 



GGC 
Gly 
65 



AAT 
Asn 



CGC AGG CGT 
Arg Ser Arg 



GAG CAA 
Glu Gin 
70 



665 




ACA CTG 
Thr Leu 



,CGC GAG 
rg Glu 



TTT CCA 
Phe Pro 
105 



CTT TGC GAG ATT GCT GGC TCG GTG GCA AGC CTG AAG GAT AGC 
Leu Cys Asp He Ala Gly Ser Val Ala Ser Leu Lys Asp Ser 
75 80 85 

CAC GTG GCC AAA TGG ATG GAG GCC GAA CAT CAC AAG GCG ATG 
His Val Ala Lys Trp Met Glu Pro Glu His His Lys Ala Met 
90 95 100 

GGG GCG GAG GCA CGC GTT GAG TTT CAG CCG CTG GGT GTC GTT 
Gly Ala Glu Ala Arg Val Glu Phe Gin Pro Leu Gly Val Val 
110 115 



713 



761 



809 



GGG GTC 
Gly Val 
120 



ATT AGT CCC TGG AAC TTC CCT ATC GTA CTG GCC TTT GGG CCG 
He Ser Pro Trp Asn Phe Pro He Val Leu Ala Phe Gly Pro 
125 130 135 



857 



CTG GCC 
Leu Ala 



GGC 
Gly 



ATA TTC 
He Phe 
140 



GCA GCA GGT AAT 
Ala Ala Gly Asn 



CGC 
Arg 
145 



GCC ATG 
Ala Met 



CTG AAG 
Leu Lys 



CCG 
Pro 
150 



TCG 
Ser 



905 



GAG CTT ACC CeG-eGG-AeT— TCT- GCC G-TG-CT-T- 
Glu Leu Thr Pro Arg Thr Ser Ala Leu Leu 
155 160 



GCG- GAG- GTA ATT-GCT-eGT 
Ala Glu Leu He Ala Arg 
165 



95 3 
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TAC TTC GAT GAA ACT GAG CTG ACT AC A GTG CTG GGC GAC GOT GAA GTC 1001 

Tyr Phe Asp Glu Thr Glu Leu Thr Thr Val Leu Gly Asp Ala Glu Val 
170 175 180 

GGT GCG CTG TTC AGT GCT CAG CCT TTC GAT CAT CTG ATC TTC ACC GGC 104 9 

Gly Ala Leu Phe Ser Ala Gin Pro Phe Asp His Leu He Phe Thr Gly 
185 190 195 

GGC ACT GCC GTG GCC AAG CAC ATC ATG CGT GCC GCG GCG GAT AAC CTA 1097 

Gly Thr Ala Val Ala Lys His He Met Arg Ala Ala Ala Asp Asn Leu 

200 205 210 215 

GTG CCC GTT ACC CTG GAA TTG GGT GGC AAA TCG CCG GTG ATC GTT TCC 114 5 

Val Pro Val Thr Leu Glu Leu Gly Gly Lys Ser Pro Val He Val Ser 

'?'?n 



CGC AGT GCA GAT ATG GCG GAC GTT GCA CAA CGG GTG TTG ACG GTG AAA 1193 
^rg Ser Ala Asp Met Ala Asp Val Ala Gin Arg Val Leu Thr Val Lys 
235 240 245 



A 



CC TTC AAT GCC GGG CAA ATC TGT CTG GCA CC GTG GGT GAG TCG AAC 124 0 

Thr Phe Asn Ala Gly Gin He Cys Leu Ala Val Gly Glu Ser Asn 
250 255 257 454 455 

TTG GCG ATG CGC GCA CCC TAC GGA GAA GCG ATC CAC GGA CTG CTC TCT 1288 
Leu Ala Met Arg Ala Pro Tyr Gly Glu Ala He His Gly Leu Leu Ser 
460 465 470 

GTC CTC CTT TCA ACG GAG TGT TAG AACCGTTGGT AGTGGTTTTG GACGGGCCCA 1342 
Val Leu Leu Ser Thr Glu Cys 
475 480 481 

GGAGCATGCG CTTCTGGGCC CGTTTCTTGA GTATTCATTG GATAGTCACG CGTGGTAGCT 14 02 

TCGAGCCTGC ACAGCTGATG AGCACCCTGG AAGGCGCGCT GTACGCGGAC GACTGGGTTC 14 62 

ATCTTCGCCA TTCATGACGG AACTCCGTTC CCCAGTACCG CGATGACTAT TTTGCCTCTT 1522 

f;CGATGTCCG ATTCCACGCC GCCTGACGCT AAGCGGGGGC GGGGGCGCCC GCATCCCAGC 1582 

CAGACAGCA ACAAATGAGT AGGCTCTTGG ATGCCGCGGC GGCTGAGATT GGTAACGGCA 1642 

ATTTCGTCAA TGTGACGATG GATTCGATTG CCCGTGCTGC CGGCGTCTCA AAAAAAACGC 1702 

TGTACGTCTT GGTGGCGAGC AAGGAAGAAC TCATTTCCCG GTTAGTGGCT CGAGACATGT 17 62 

CCAACCTTGA GGAATTC 177 9 



FIG, 2f: 
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CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 240 

AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG G ATG CGT TOT CTC GAG 35 6 

Met Arg Ser Leu Glu 
1 5 

-g€?g-CT?-G??"CGC TTG CCG GGT GQjr^-*I^GOT>--^j^-e^T't^Ter GAG CAT- TOQ— — ^O-j 
Ala Leu Leu Pro Phe Pro Gly Arg lie Leu Glu Arg Leu Glu His Trp 
10 15 20 

|GCT AAG ACC CGT CCA GAA CAA ACC TGC GTT GCT GCC AGG GCG GCA AAT 4 52 

Ala Lys Thr Arg Pro Glu Gin Thr Cys Val Ala Ala Arg Ala Ala Asn 
25 30 35 

GGG GAA TGG CGT CGT ATC AGC TAG GCG GAA ATG TTC CAC AAC GTC CGC 500 
Gly Glu Trp Arg Arg lie Ser Tyr Ala Glu Met Phe His Asn Val Arg 
40 45 50 

GCC ATC GCA CAG AGC TTG CTT CCT TAG GGA CTA TCG GCA GAG CGT CCG 54 8 

Ala lie Ala Gin Ser Leu Leu Pro Tyr Gly Leu Ser Ala Glu Arg Pro 
55 60 65 

CTG CTT ATC GTC TCT GGA AAT GAC CTG GAA CAT CTT CAG CTG GCA TTT 5 96 

Leu Leu lie Val Ser Gly Asn Asp Leu Glu His Leu Gin Leu Ala Phe 
70 75 80 85 

GGG GCT ATG TAT GCG GGC ATT GCC TAT TGC CCG GTG TCT CCT GCT TAT 64 4 

Gly Ala Met Tyr Ala Gly lie Pro Tyr Cys Pro Val Ser Pro Ala Tyr 
90 95 100 

TCA CTG CTG TCG CAA GAT TTG GCG AAG CTG CGT CAC ATC GTA GGT CTT 692 
Ser Leu Leu Ser Gin Asp Leu Ala Lys Leu Arg His lie Val Gly Leu 
105 110 115 

CTG CAA CCG GGA CTG GTC TTT GCT GCC GAT GCA GCA CCT TTC CAG GGG 74 0 

Leu Gin Pro Gly Leu Val Phe Ala Ala Asp Ala Ala Pro Phe Gin 
120 125 130 132 

ACAGCAAGCG AACCGGAATT GCCAGCTGGG GCGCCCTCTG GTAAGGTTGG GAAGCCCTGC 8 00 

AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGGATCTGAT GGCGCAGGGG ATCAAGATCT 8 60 

GATCAAGAGA CAGGATGAGG ATCGTTTCGC ATG ATT GAA CAA GAT GGA TTG CAC 914 

Met lie Glu Gin Asp Gly Leu His 
1 5 

GCA GGT TCT CCG-GCC-GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC TGG 962 

Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp Trp 
10 15 20 
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GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG TCA 1010 
Ala Gin Gin Thr lie Gly Cys Ser Asp Ala Ala Val Phe Arg Leu Ser 
25 30 35 40 

GCG CAG GGG CGG CCG GTT CTT TTT GTC AAG ACC GAG CTG TCC GGT GCC 1058 
Ala Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly Ala 
45 50 55 

CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC ACG 1106 
Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala Thr 
60 65 70 

ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC ACT GAA GCG GGA 1154 
Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val Thr Glu Ala Gly 





9:j 00 
agg gac tgg ctg cta ttg ggc gaa gtg ccg ggg cag gat ctc ctg tca 1202 

Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin Asp Leu Leu Ser 
90 95 100 

TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA ATG 1250 
Ser His Leu Ala Pro Ala Glu Lys Val Ser He Met Ala Asp Ala Met 
105 110 115 120 

CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC CAA 12 98 

Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His Gin 
125 130 135 

GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT CTT 134 6 

Ala Lys His Arg He Glu Arg Ala Arg Thr Arg Met Glu Ala Gly Leu 
140 145 150 

GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA GCC 1394 
Val Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly Leu Ala Pro Ala 
155 160 165 

GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT CTC 14 42 

Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp Leu 
170 175 180 

GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA AAT 14 90 

Val Val Thr His Gly Asp Ala Cys Leu Pro Asn He Met Val Glu Asn 
185 190 195 200 

GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG GAC 1538 
Gly Arg Phe Ser Gly Phe He Asp Cys Gly Arg Leu Gly Val Ala Asp 
205 210 215 

CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG CTT 158 6 

Arg Tyr Gin Asp He Ala Leu Ala Thr Arg Asp He Ala Glu Glu Leu 
220 225 230 

GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAG GGT ATC GCC GCT 1634 

Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly He Ala Ala 

235 240 245 
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CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAG GAG TTC TTC 1682 
Pro Asp Ser Gin Arg lie Ala Phe Tyr Arg Leu Leu Asp Glu Phe Phe 
250 255 260 264 

TGAGCGGGAC TCTGGGGTTC GAAATGACCG ACCAAGCGAC GCCCCT GTT TTG CAA 1737 

Val Leu Gin 
563 565 

TGG CGG TCG GCG AAA GTT GAT GCG CTG TAT CGT GGT GAA GAT CAA TCC 1785 
Trp Arg Ser Ala Lys Val Asp Ala Leu Tyr Arg Gly Glu Asp Gin Ser 
570 575 580 

ATG CTG CGT GAC GAG GCC ACA CTG TGA GTTGGTCAGG GGGGGCTTAC 1832 
Met Leu Arg Asp Glu Ala Thr Leu 




TCGGCGTTTT CCGACACTGC GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG 18 92 

GTGCCCTGT CGCTGGTGTC GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG 1952 

ATGCGTGCGT CGCTTGAACC ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA 2012 

GCAAGCTTTG ATGCTTACCT GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG 2072 

TCGGTTCCGG CCTTGGGGGT GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG 2132 

GCCGGCGAGC AGATTTCCCA AGGCGCTGAT CACGTGCTGT GTGTCGCGGG CTGCAG 218 8 
FIG. 2g: 
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CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 24 0 

AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG G ATG CGT TCT CTC GAG 356 

Met Arg Ser Leu Glu 
1 5 

(^(^(^, nrp^ nn^ty nnn rprpo rcc nn^ ncTs. z^n^nn r^pfp r:ar: pr:T ptp r:ar; r'am , ^ f^(^ a(\a 
Ala Leu Leu Pro Phe Pro Gly Arg lie Leu Glu Arg Leu Glu His Trp 
10 15 20 



CT AAG ACC CGT CCA GAA CAA ACC TGC GTT GCT GCC AGG GCG GCA AAT 452 
la Lys Thr Arg Pro Glu Gin Thr Cys Val Ala Ala Arg Ala Ala Asn 
25 30 35 




GGG GAA TGG CGT CGT ATC AGO TAC GCG GAA ATG TTC CAC AAC GTC CGC 500 
Gly Glu Trp Arg Arg lie Ser Tyr Ala Glu Met Phe His Asn Val Arg 
40 45 50 

GCC ATC GCA CAG AGC TTG CTT CCT TAC GGA CTA TCG GCA GAG CGT CCG 548 
Ala He Ala Gin Ser Leu Leu Pro Tyr Gly Leu Ser Ala Glu Arg Pro 
55 60 65 

CTG CTT ATC GTC TCT GGA AAT GAC CTG GAA CAT CTT CAG CTG GCA TTT 596 
Leu Leu He Val Ser Gly Asn Asp Leu Glu His Leu Gin Leu Ala Phe 
70 75 80 85 

GGG GCT ATG TAT GCG GGC ATT CCC TAT TGC CCG GTG TCT CCT GCT TAT 64 4 

Gly Ala Met Tyr Ala Gly He Pro Tyr Cys Pro Val Ser Pro Ala Tyr 
90 95 100 

TCA CTG CTG TCG CAA GAT TTG GCG AAG CTG CGT CAC ATC GTA GGT CTT 692 
Ser Leu Leu Ser Gin Asp Leu Ala Lys Leu Arg His He Val Gly Leu 
105 110 115 

CTG CAA CCG GGA CTG GTC TTT GCT GCC GAT GCA GCA CCT TTC CAG GGG 74 0 

Leu Gin Pro Gly Leu Val Phe Ala Ala Asp Ala Ala Pro Phe Gin 
120 125 130 132 

GAGAGGCGGT TTGCGTATTG GGCGCATGCA TAAAAACTGT TGTAATTCAT TAAGCATTCT 800 

GCCGACATGG AAGCCATCAC AAACGGCATG ATGAACCTGA ATCGCCAGCG GCATCAGCAC 8 60 

CTTGTCGCCT TGCGTATAAT ATTTGCCCAT GGACGCACAC CGTGGAAACG GATGAAGGCA 920 

CGAACCCAGT TGACATAAGC CTGTTCGGTT CGTAAACTGT AATGCAAGTA GCGTATGCGC 980 

TCACGCAACT GGTGGAGAAC-CTTGACCGAA CGCAGCGGTG GTAACGGCGC AGTGGCGGTT -1040 



TTCATGGCTT GTTATGACTG TTTTTTTGTA CAGTCTATGC CTCGGGCATC CAAGCAGCAA 1100 
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GCGCGTTACG CCGTGGGTCG ATGTTTGATG TTATGGAGCA GCAACG ATG TTA CGC 

Met Leu Arg 
1 

AGC AGC AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA ACA AAG TTA 
Ser Ser Asn Asp Val Thr Gin Gin Gly Ser Arg Pro Lys Thr Lys Leu 
5 10 15 

GGT GGC TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC GGC CCT GAC 
Gly Gly Ser Ser Met Gly lie lie Arg Thr Cys Arg Leu Gly Pro Asp 
20 25 30 35 

CAA GTC AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT CGT GAG TTC 
Gin Val Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly Arg Glu Phe 

^'^ 



GGA GAC GTA GCC ACC TAG TCC CAA CAT CAG CCG GAC TCC GAT TAC CTC 
Gly Asp Val Ala Thr Tyr Ser Gin His Gin Pro Asp Ser Asp Tyr Leu 
55 60 65 

GGG AAC TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT GCC TTC GAC 
Gly Asn Leu Leu Arg Ser Lys Thr Phe lie Ala Leu Ala Ala Phe Asp 
70 75 80 

CAA GAA GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG CCC AGG TTT 
Gin Glu Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu Pro Arg Phe 
85 90 95 

GAG CAG CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA GTC TCC GGC 
Glu Gin Pro Arg Ser Glu lie Tyr lie Tyr Asp Leu Ala Val Ser Gly 
100 105 110 115 

GAG CAC CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT CTC CTC AAG 
Glu His Arg Arg Gin Gly lie Ala Thr Ala Leu lie Asn Leu Leu Lys 
120 125 130 

CAT GAG GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG CAA GCA GAT 
His Glu Ala Asn Ala Leu Gly Ala Tyr Val lie Tyr Val Gin Ala Asp 
135 140 145 

TAC GGT GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG GGC ATA CGG 
Tyr Gly Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu Gly lie Arg 
150 155 160 

GAA GAA GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC ACC TAA CAA 
Glu Glu Val Met His Phe Asp lie Asp Pro Ser Thr Ala Thr 
165 170 175 177 

TTCGTTCAAG CCGAGATCGG CTTCCCCT GTT TTG CAA TGG CGG TCG GCG AAA 

Val Leu Gin Trp Arg Ser Ala Lys 
563 565 570 

GTT GAT GCG CTG TAT CGT GGT GAA GAT CAA TCC ATG CTG CGT GAC GAG 
Val Asp Ala Leu Tyr Arg Gly Glu Asp Gin Ser Met Leu Arg Asp Glu 
5-7^ 580_ . 585 
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GCC ACA CTG TGA GTTGGTCAGG GGGGGCTTAC TCGGCGTTTT CCGACACTGC 18 35 
Ala Thr Leu 
589 

GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG GGTGCCCTGT CGCTGGTGTC 18 95 

GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG ATGCGTGCGT CGCTTGAACC 1955 

ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA GCAAGCTTTG ATGCTTACCT 2015 

GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT 2075 

GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG GCCGGCGAGC AGATTTCCCA 2135 
^j^iGGei^GTGAT Gj^iCGTCCTCT CTCTCGGGC&n CTGi^AiS ■ 7171 



FIG. 2h: 
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CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 240 

AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG G ATG CGT TCT CTC GAG 35 6 

Met Arg Ser Leu Glu 
1 5 



f-nn nrrrp n^rj. ^nn ^r^r^ ppf-; nn^ nni\ att PT T C , 1\C , nCT CTC GAG CAT T(^<^ -^IQA, 

Ala Leu Leu Pro Phe Pro Gly Arg lie Leu Glu Arg Leu Glu His Trp 

10 15 20 

CT AAG AGO CGT CCA GAA CAA ACC TGC GTT GCT GCC AGG GCG GCA AAT 4 52 

Ala Lys Thr Arg Pro Glu Gin Thr Cys Val Ala Ala Arg Ala Ala Asn 

25 30 35 

GGG GAA TGG CGT CGT ATC AGC TAC GCG GAA ATG TTC CAC AAC GTC CGC 500 

Gly Glu Trp Arg Arg lie Ser Tyr Ala Glu Met Phe His Asn Val Arg 

40 45 50 

GCC ATC GCA CAG AGC TTG CTT CCT TAC GGA CTA TCG GCA GAG CGT CCG 54 8 

Ala lie Ala Gin Ser Leu Leu Pro Tyr Gly Leu Ser Ala Glu Arg Pro 

55 60 65 

CTG CTT ATC GTC TCT GGA AAT GAC CTG GAA CAT CTT CAG CTG GCA TTT 5 96 

Leu Leu lie Val Ser Gly Asn Asp Leu Glu His Leu Gin Leu Ala Phe 

70 75 80 85 

GGG GCT ATG TAT GCG GGC ATT CCC TAT TGC CCG GTG TCT CCT GCT TAT 64 4 

Gly Ala Met Tyr Ala Gly lie Pro Tyr Cys Pro Val Ser Pro Ala Tyr 

90 95 100 

TCA CTG CTG TCG CAA GAT TTG GCG AAG CTG CGT CAC ATC GTA GGT CTT 692 

Ser Leu Leu Ser Gin Asp Leu Ala Lys Leu Arg His lie Val Gly Leu 

105 110 115 

CTG CAA CCG GGA CTG GTC TTT GCT GCC GAT GCA GCA CCT TTC CAG CGC 740 

Leu Gin Pro Gly Leu Val Phe Ala Ala Asp Ala Ala Pro Phe Gin Arg 

120 125 130 133 

GCT GTT TTG CAA TGG CGG TCG GCG AAA GTT GAT GCG CTG TAT CGT GGT 78 8 

Ala Val Leu Gin Trp Arg Ser Ala Lys Val Asp Ala Leu Tyr Arg Gly 

562 565 570 575 

GAA GAT CAA TCC ATG CTG CGT GAC GAG GCC ACA CTG TGA GTTGGTCAGG 837 

Glu Asp Gin Ser Met Leu Arg Asp Glu Ala Thr Leu 

580 585 589 

GGGGGCTTAe—T-GGGGGT-T-T-T— CCGACACTGC - GTTGGTTGCG GCAGTGCGCA CCCCaTGGAT _8_97 



TGATTGCGGG GGTGCCCTGT CGCTGGTGTC GCCTATCGAC TTAGGGGTAA AGGTCGCTCG - 957 
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CGAAGTTCTG ATGCGTGCGT CGCTTGAACC ACAAATGGTC GATAGCGTAC TCGCAGGCTC 1017 

TATGGCTCAA GCAAGCTTTG ATGCTTACCT GCTCCCGCGG CACATTGGCT TGTACAGCGG 107 7 

TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT GCAGCGCATT TGCGGCACAG GCTTCGAACT 1137 

GCTTCGGCAG GCCGGCGAGC AGATTTCCCA AGGCGCTGAT CACGTGCTGT GTGTCGCGGG 1197 

CTGCAG 1203 
FIG. 2i: 
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GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 24 0 

GGTGCACG ATG AAT AGC TAG GAT GGC CGT TGG TCT AGO GTT GAT GTG AAG 2 90 

Met Asn Ser Tyr Asp Gly Arg Trp Ser Thr Val Asp Val Lys 
15 10 

GTT GAA GAA GGT ATC GOT TGG GTC ACG CTG AAC CGC CCG GAG AAG GGC 338 
Val Glu Glu Gly lie Ala Trp Val Thr Leu Asn Arg Pro Glu Lys Arg 

25 -^n 

AAC GCA ATG AGC CCA ACT CTC AAT CGA GAG ATG GTC GAG GTT CTG GAG 38 6 

Asn Ala Met Ser Pro Thr Leu Asn Arg Glu Met Val Glu Val Leu Glu 
35 40 45 

GTG CTG GAG CAG GAC GCA GAT GCT CGC GTG CTT GTT CTG ACT GGT GCA 4 34 

Val Leu Glu Gin Asp Ala Asp Ala Arg Val Leu Val Leu Thr Gly Ala 
50 55 60 

GGC GAA TCC TGG ACC GCG GGC ATG GAC CTG AAG GAG TAT TTC CGC GAG 4 82 

Gly Glu Ser Trp Thr Ala Gly Met Asp Leu Lys Glu Tyr Phe Arg Glu 
65 70 75 

ACC GAT GCT GGC CCC GAA ATT CTG CAA GAG AAG ATT CGT CGGGGACAGC 531 
Thr Asp Ala Gly Pro Glu lie Leu Gin Glu Lys lie Arg 
80 85 90 91 

AAGCGAACCG GAATTGCCAG CTGGGGCGCC CTCTGGTAAG GTTGGGAAGC CCTGCAAAGT 591 

AAACTGGATG GCTTTCTTGC CGCCAAGGAT CTGATGGCGC AGGGGATCAA GATCTGATCA 651 

AGAGACAGGA TGAGGATCGT TTCGC ATG ATT GAA CAA GAT GGA TTG CAC GCA 703 

Met lie Glu Gin Asp Gly Leu His Ala 
1 5 

GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC TGG GCA 751 

Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp Trp Ala 
10 15 20 25 

CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG TCA GCG 7 99 

Gin Gin Thr lie Gly Cys Ser Asp Ala Ala Val Phe Arg Leu Ser Ala 
30 35 40 

CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT GCC CTG 84 7 

Gin Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly Ala Leu 
45 50 55 

AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC ACG ACG 8 95 

Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala Thr Thr 
60 65 70 
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GGC GTT CCT TGC GCA GCT GTG CTC GAG GTT GTC 
Gly Val Pro Cys Ala Ala Val Leu Asp Val Val 
75 80 



ACT GAA GCG GGA AGG 
Thr Glu Ala Gly Arg 
85 



943 



GAG 


TGG 


CTG 


CTA 


TTG 


GGC 


GAA 


GTG 


CCG 


GGG 


CAG 


GAT 


CTC 


CTG 


TCA 


TCT 


991 


Asp 


Trp 


Leu 


Leu 


Leu 


Gly 


Glu 


Val 


Pro 


Gly 


Gin 


Asp 


Leu 


Leu 


Ser 


Ser 




90 










95 










100 










105 




CAC 


CTT 


GCT 


CCT 


GCC 


GAG 


AAA 


GTA 


TCC 


ATC 


ATG 


GCT 


GAT 


GCA 


ATG 


CGG 


1039 


His 


Leu 


Ala 


Pro 


Ala 


Glu 


Lys 


Val 


Ser 


lie 


Met 


Ala 


Asp 


Ala 


Met 


Arg 












110 










115 










120 






CGG 


CTG 


CAT 


ACG 


CTT 


GAT 


CCG 


GCT 


ACC 


TGC 


CCA 


TTC 


GAC 


CAC 


CAA 


GCG 


1087 


Arg 


Leu 


His 


Thr 
125 


Leu 


Asp 


Pro 


Ala 


Thr 


Cys 


Pro 


Phe 


Asp 


His 

T -^ -S . 


Gin 


Ala 




AAA 


CAT 


CGC 


ATC 


GAG 


CGA 


GCA 


CGT 


ACT 


CGG 


ATG 


GAA 


GCC 


GGT 


CTT 


GTC 


1135 


^B^k^^^^Lys 


His 


Arg 


lie 


Glu 


Arg 


Ala 


Arg 


Thr 


Arg 


Met 


Glu 


Ala 


Gly 


Leu 


Val 








140 










145 










150 










^B^^GAT 


CAG 


GAT 


GAT 


CTG 


GAC 


GAA 


GAG 


CAT 


CAG 


GGG 


CTC 


GCG 


CCA 


GCC 


GAA 


1183 


Asp 


Gin 


Asp 


Asp 


Leu 


Asp 


Glu 


Glu 


His 


Gin 


Gly 


Leu 


Ala 


Pro 


Ala 


Glu 






155 










160 










165 












CTG 


TTC 


GCC 


AGG 


CTC 


AAG 


GCG 


CGC 


ATG 


CCC 


GAC 


GGC 


GAG 


GAT 


CTC 


GTC 


1231 


Leu 


Phe 


Ala 


Arg 


Leu 


Lys 


Ala 


Arg 


Met 


Pro 


Asp 


Gly 


Glu 


Asp 


Leu 


Val 




170 










175 










180 










185 





GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC 
Val Thr His Gly Asp Ala Cys Leu Pro Asn lie 
190 195 



ATG GTG GAA AAT GGC 
Met Val Glu Asn Gly 
200 



1279 



CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG 
Arg Phe Ser Gly Phe lie Asp Cys Gly Arg Leu 
205 210 



GGT GTG GCG GAC CGC 
Gly Val Ala Asp Arg 
215 



1327 




TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT 
Tyr Gin Asp lie Ala Leu Ala Thr Arg Asp lie 
220 225 

GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC 
Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr 
235 240 



GCT GAA GAG CTT GGC 137 5 

Ala Glu Glu Leu Gly 
230 

GGT ATC GCC GCT CCC 14 23 

Gly lie Ala Ala Pro 

245 



GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT 
Asp Ser Gin Arg lie Ala Phe Tyr Arg Leu Leu 
250 255 260 



GAC GAG TTC TTC TGA 
Asp Glu Phe Phe 
264 



1471 



GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC 



CC GAG CAG GGC ATG 
Glu Gin Gly Met 
255 



1525 



AAG CAG TTC CTT GAC GAG AAA AGC ATC AAG CCG 
Lys Gin Phe Leu Asp Glu Lys Ser lie Lys Pro 
260 265 



GGC TTG CAG ACC TAC 
Gly Leu Gin Thr Tyr 
270 



1573 
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AAG CGC TGA TAAATGCGCC GGGGCCCTCG CTGCGCCCCC GGCCTTCCAA TAATGACAAT 1632 
Lys Arg 
275 276 

AATGAGGAGT GCCCAATGTT TCACGTGCCC CTGCTTATTG GTGGTAAGCC TTGTTCAGCA 1692 

TCTGATGAGC GCACCTTCGA GCGTCGTAGC CCGCTGACCG GAGAAGTGGT ATCGCGCGTC 1752 

GCTGCTGCCA GTTTGGAAGA TGCGGACGCC GCAGTGGCCG CTGCACAGGC TGCGTTTCCT 1812 

GAATGGGCGG CGCTTGCTCC GAGCGAACGC CGTGCCCGAC TGCTGCGAGC GGCGGATCTT 1872 

CTAGAGGACC GTTCTTCCGA GTTCACCGCC GCAGCGAGTG AAACTGGCGC AGCGGGAAAC 1932 

Taa^nrvmaa^ TTaarr^TTTa rrTnnnncr.n nnr.ATCTTnr nnnGAATTf: -^-^^ 

FIG. 2j: 
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GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 24 0 

GGTGCACG ATG AAT AGC TAG GAT GGC CGT TGG TCT ACC GTT GAT GTG AAG 290 
Met Asn Ser Tyr Asp Gly Arg Trp Ser Thr Val Asp Val Lys 
15 10 

GTT GAA GAA GGT ATC GCT TGG GTC ACG GTG AAC CGC CCG GAG AAG GGC 338 
Val Glu Glu Gly lie Ala Trp Val Thr Leu Asn Arg Pro Glu Lys Arg 
1"' ^5 30 

AAC GCA ATG AGC CCA ACT CTC AAT CGA GAG ATG GTC GAG GTT CTG GAG 38 6 

Asn Ala Met Ser Pro Thr Leu Asn Arg Glu Met Val Glu Val Leu Glu 
35 40 45 

GTG CTG GAG CAG GAG GCA GAT GCT CGC GTG CTT GTT CTG ACT GGT GCA 4 34 

Val Leu Glu Gin Asp Ala Asp Ala Arg Val Leu Val Leu Thr Gly Ala 
50 55 60 

GGC GAA TCC TGG ACC GCG GGC ATG GAC CTG AAG GAG TAT TTC CGC GAG 4 82 

Gly Glu Ser Trp Thr Ala Gly Met Asp Leu Lys Glu Tyr Phe Arg Glu 
65 70 75 

ACC GAT GCT GGC CCC GAA ATT CTG CAA GAG AAG ATT CGT CGGGGGAGAG 531 
Thr Asp Ala Gly Pro Glu lie Leu Gin Glu Lys lie Arg 
80 85 90 91 

GCGGTTTGCG TATTGGGCGC ATGCATAAAA ACTGTTGTAA TTCATTAAGC ATTCTGCCGA 5 91 

CATGGAAGCC ATCACAAACG GCATGATGAA CCTGAATCGC CAGCGGCATC AGCACCTTGT 651 

CGCCTTGCGT ATAATATTTG CCCATGGACG CACACCGTGG AAACGGATGA AGGCACGAAC 711 

CCAGTTGACA TAAGCCTGTT CGGTTCGTAA ACTGTAATGC AAGTAGCGTA TGCGCTCACG 771 

CAACTGGTCC AGAACCTTGA CCGAACGCAG CGGTGGTAAC GGCGCAGTGG CGGTTTTCAT 831 

GGCTTGTTAT GACTGTTTTT TTGTACAGTC TATGCCTCGG GCATCCAAGC AGCAAGCGCG 8 91 

TTACGCCGTG GGTCGATGTT TGATGTTATG GAGCAGCAAC G ATG TTA CGC AGC AGC 947 

Met Leu Arg Ser Ser 
1 5 

AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA ACA AAG TTA GGT GGC 995 
Asn Asp Val Thr Gin Gin Gly Ser Arg Pro Lys Thr Lys Leu Gly Gly 
10 15 20 



TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC GGC CCT GAC CAA GTC 
Ser Ser Met Gly lie lie Arg Thr Cys Arg Leu Gly Pro Asp Gin Val 

. 2-5 30 . 3.5 



1043 
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AAA TCC ATG CGG GCT GOT CTT GAT CTT TTC GGT CGT GAG TTC GGA GAG 10 91 

Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly Arg Glu Phe Gly Asp 

40 45 50 

GTA GCC AGO TAG TCC CAA CAT CAG CCG GAG TCC GAT TAG CTC GGG AAC 1139 

Val Ala Thr Tyr Ser Gin His Gin Pro Asp Ser Asp Tyr Leu Gly Asn 

55 60 65 

TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT GCC TTC GAG CAA GAA 1187 

Leu Leu Arg Ser Lys Thr Phe lie Ala Leu Ala Ala Phe Asp Gin Glu 

70 75 80 85 

GCG GTT GTT GGC GCT CTC GCG GCT TAG GTT CTG CCG AGG TTT GAG CAG 1235 

Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu Pro Arg Phe Glu Gin 



CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA GTC TCC GGC GAG CAC 1283 
Pro Arg Ser Glu lie Tyr lie Tyr Asp Leu Ala Val Ser Gly Glu His 
105 110 115 

CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT CTC CTC AAG CAT GAG 1331 
Arg Arg Gin Gly lie Ala Thr Ala Leu lie Asn Leu Leu Lys His Glu 
120 125 130 

GCC AAC GCG CTT GGT GCT TAT GTG ATC TAG GTG CAA GCA GAT TAG GGT 137 9 

Ala Asn Ala Leu Gly Ala Tyr Val lie Tyr Val Gin Ala Asp Tyr Gly 
135 140 145 

GAG GAT GCC GCA GTG GCT CTC TAT ACA AAG TTG GGC ATA CGG GAA GAA 14 27 

Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu Gly lie Arg Glu Glu 
150 155 160 165 

GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC ACC TAA CAATTCGTTC 14 7 6 

Val Met His Phe Asp lie Asp Pro Ser Thr Ala Thr 
170 175 177 

AAGCCGAGAT CGGCTTCCCC GAG CAG GGC ATG AAG CAG TTC CTT GAC GAG 1526 

Glu Gin Gly Met Lys Gin Phe Leu Asp Glu 
255 260 

AAA AGG ATC AAG CCG GGC TTG CAG ACC TAG AAG CGG TGA TAAATGCGCC 1575 
Lys Ser lie Lys Pro Gly Leu Gin Thr Tyr Lys Arg 
265 270 275 276 

GGGGCCCTCG CTGCGCCCCC GGCCTTCCAA TAATGACAAT AATGAGGAGT GCCCAATGTT 1635 

TCACGTGCCC CTGCTTATTG GTGGTAAGCC TTGTTCAGCA TCTGATGAGC GCACCTTCGA 1695 

GCGTCGTAGC CCGCTGACCG GAGAAGTGGT ATCGCGCGTC GCTGCTGCCA GTTTGGAAGA 1755 

TGCGGACGCC GCAGTGGCCG CTGCACAGGC TGCGTTTCCT GAATGGGCGG CGCTTGCTCC 1815 

GAGCGAACGC CGTGCCCGAC TGCTGCGAGC GGCGGATCTT CTAGAGGACC GTTCTTCCGA 187 5 
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GTTCACCGCC GCAGCGAGTG AAACTGGCGC AGCGGGAAAC TGGTATGGGT TTAACGTTTA 1935 
CCTGGCGGCG GGCATGTTGC GGGGAATTC 1964 
FIG. 2k: 
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GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 24 0 

GGTGCACG ATG AAT AGO TAG GAT GGC CGT TGG TCT ACC GTT GAT GTG AAG 2 90 
Met Asn Ser Tyr Asp Gly Arg Trp Ser Thr Val Asp Val Lys 
15 10 

GTT GAA GAA GGT ATC GCT TGG GTC ACG GTG AAC GGC COG GAG AAG GGC 338 
Val Glu Glu Gly lie Ala Trp Val Thr Leu Asn Arg Pro Glu Lys Arg 




AAC GCA ATG AGC CCA ACT CTC AAT CGA GAG ATG GTC GAG GTT CTG GAG 38 6 

Asn Ala Met Ser Pro Thr Leu Asn Arg Glu Met Val Glu Val Leu Glu 
35 40 45 

GTG CTG GAG CAG GAC GCA GAT GCT GGC GTG GTT GTT CTG ACT GGT GCA 4 34 

Val Leu Glu Gin Asp Ala Asp Ala Arg Val Leu Val Leu Thr Gly Ala 
50 55 60 

GGC GAA TCC TGG ACC GCG GGC ATG GAC CTG AAG GAG TAT TTC GGC GAG 4 82 

Gly Glu Ser Trp Thr Ala Gly Met Asp Leu Lys Glu Tyr Phe Arg Glu 
65 70 75 

ACC GAT GCT GGC CCC GAA ATT CTG CAA GAG AAG ATT CGT GGC GAG CAG 530 
Thr Asp Ala Gly Pro Glu lie Leu Gin Glu Lys lie Arg Arg Glu Gin 
80 85 90 92 255 

GGC ATG AAG CAG TTC CTT GAC GAG AAA AGC ATC AAG CCG GGC TTG CAG 57 8 

Gly Met Lys Gin Phe Leu Asp Glu Lys Ser He Lys Pro Gly Leu Gin 
260 265 270 

ACC TAG AAG CGC TGA TAAATGCGCC GGGGCCCTCG CTGCGCCCCC GGCCTTCCAA , 633 

Thr Tyr Lys Arg 
275 276 

TAATGACAAT AATGAGGAGT GCCCAATGTT TCACGTGCCC CTGCTTATTG GTGGTAAGCC 693 

TTGTTCAGCA TCTGATGAGC GCACCTTCGA GCGTCGTAGC CCGCTGACCG GAGAAGTGGT 753 

ATCGCGCGTC GCTGCTGCCA GTTTGGAAGA TGCGGACGCC GCAGTGGCCG CTGCACAGGC 813 

TGCGTTTCCT GAATGGGCGG CGCTTGCTCC GAGCGAACGC CGTGCCCGAC TGCTGCGAGC 87 3 

GGCGGATCTT CTAGAGGACC GTTCTTCCGA GTTCACCGCC GCAGCGAGTG AAACTGGCGC 933 

AGCGGGAAAC TGGTATGGGT TTAACGTTTA CCTGGCGGCG GGCATGTTGC GGGGAATTC 992 




FIG. 21: 
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GAATTCCAAT AATGACAATA ATGAGGAGTG CCCA ATG TTT CAC GTG CCC CTG CTT 

Met Phe His Val Pro Leu Leu 
1 5 



55 



ATT GGT GGT AAG CCT TGT TCA GCA TCT GAT GAG CGC ACC TTC GAG CGT 
lie Gly Gly Lys Pro Cys Ser Ala Ser Asp Glu Arg Thr Phe Glu Arg 
10 15 20 



103 



CGT AGC CCG CTG ACC GGA GAA GTG GTA TCG CGC GTC GCT GCT GCC AGT 
Arg Ser Pro Leu Thr Gly Glu Val Val Ser Arg Val Ala Ala Ala Ser 
25 30 35 



151 



TTG GAA GAT GCG GAC GCC GCA GTG GCC GCT GCA CAG GCT GCG TTT CCT 
Leu Glu Asp Ala Asp Ala Ala Val Ala Ala Ala Gin Ala Ala Phe Pro 
, 40 4^ fSQ _55_ 



199 




GAA TGG GCG GCG 
Glu Trp Ala Ala 



GCG GCG 
Ala Ala 



GAT CTT 
Asp Leu 
75 



CTT GCT CCG AGC 
Leu Ala Pro Ser 
60 

CTA GAG GAC CGT 
Leu Glu Asp Arg 



GAA CGC 
Glu Arg 
65 

TCT TCC 
Ser Ser 
80 



CGT GCC CGA CTG 
Arg Ala Arg Leu 



GAG TTC ACC GCC 
Glu Phe Thr Ala 
85 



CTG CGA 
Leu Arg 
70 

GCA GCG 
Ala Ala 



247 



295 



AGT GAA ACT GGC GCA GCG GGA AAC TGG TAT 
Ser Glu Thr Gly Ala Ala Gly Asn Trp Tyr 
90 95 



GGG TTT AAC GTT 
Gly Phe Asn Val 
100 



TAC CTG 
Tyr Leu 



343 



GCG GCG GGC ATG TTG CGG GAA GCC GCG GCC 
Ala Ala Gly Met Leu Arg Glu Ala Ala Ala 
105 110 



ATG ACC ACA CAG 
Met Thr Thr Gin 
115 



ATT CAG 
He Gin 



391 



GGC GAT GTC ATT CCG TCC AAT GTG CCC GGT 
Gly Asp Val He Pro Ser Asn Val Pro Gly 
120 125 



AGC TTT GCC ATG 
Ser Phe Ala Met 
130 



GCG GTT 
Ala Val 
135 



439 



CGA CAG 
Arg Gin 




CCA TGT 
Pro Cys 



CTT GGC 
Leu Gly 
155 



GGC GTG GTG CTC 
Gly Val Val Leu 
140 

GTA CGG GCT GTT 
Val Arg Ala Val 



GGT ATT 
Gly He 
145 

GCG ATG 
Ala Met 
160 



GCG CCT TGG AAT 
Ala Pro Trp Asn 



CCG TTG GCA TGC 
Pro Leu Ala Cys 
165 



GCT CCG 
Ala Pro 
150 

GGC AAT 
Gly Asn 



487 



535 



ACC GTG GTG TTG AAA AGC TCT GAG CTG AGT 
Thr Val Val Leu Lys Ser Ser Glu Leu Ser 
170 175 



CCC TTT ACC CAT 
Pro Phe Thr His 
180 



CGC CTG 
Arg Leu 



583 



ATT GGT CAG GTG TTG CAT GAT GCT GGT CTG 
He Gly Gin Val Leu His Asp Ala Gly Leu 
185 190 



GGG GAT GGC GTG GTG AAT 
Gly Asp Gly Val Val Asn 
195 



631 



GTC ATC AGC AAT GCC CCG CAA GAC GCT CCT 
Val He Ser Asn Ala Pro Gin Asp Ala Pro 
200 205 



GCG GTG GTG GAG CGA CTG 
Ala Val Val Glu Arg Leu 
210 215 



679 
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ATT GCA AAT CCT GCG GTA CGT CGA GTG AAC TTC ACC GGT TCG ACC CAC 727 
lie Ala Asn Pro Ala Val Arg Arg Val Asn Phe Thr Gly Ser Thr His 
220 225 230 

GTT GGA CGG ATC ATT GGT GAG CTG TCT GCG CGT CAT CTG AAG CCT GCT 775 
Val Giy Arg lie lie Gly Glu Leu Ser Ala Arg His Leu Lys Pro Ala 
235 240 245 

GTG CTG GAA TTA GGT GGT AAG GCT CCG TTC TTG GTC TTG GAC GAT GCC 823 
Val Leu Glu Leu Gly Giy Lys Ala Pro Phe Leu Val Leu Asp Asp Ala 
250 255 260 

GAC CTC GAT GCG GCG GTC GAA GCG GCG GCC TTT GGT GCC TAC TTC AAT 871 
Asp Leu Asp Ala Ala Val Glu Ala Ala Ala Phe Giy Ala Tyr Phe Asn 

^-^^ . 





CAG GGT CAA ATC TGC ATG TCC ACT GAG CGT CTG ATT GTG ACA GCA GTC 919 
Gin Giy Gin lie Cys Met Ser Thr Glu Arg Leu lie Val Thr Ala Val 
'80 285 290 295 

GCA GAC GCC TTT GTT GAA AAG CTG GCG AGG AAG GTC GCC ACA CTG CGT 967 
Ala Asp Ala Phe Val Glu Lys Leu Ala Arg Lys Val Ala Thr Leu Arg 
300 305 310 

GCT GGC GAT CCT AAT GAT CCG CAA TCG GTC TTG GGT TCG TTG ATT GAT 1015 
Ala Giy Asp Pro Asn Asp Pro Gin Ser Val Leu Giy Ser Leu lie Asp 
315 320 325 

GCC AAT GCA GGT CAA CGC ATC CAG GTT CTG GTC GAT GAT GCG CTC GGG 1063 
Ala Asn Ala Gly Gin Arg lie Gin Val Leu Val Asp Asp Ala Leu 
330 335 340 342 

GACAGCAAGC GAACCGGAAT TGCCAGCTGG GGCGCCCTCT GGTAAGGTTG GGAAGCCCTG 1123 

CAAAGTAAAC TGGATGGCTT TCTTGCCGCC AAGGATCTGA TGGCGCAGGG GATCAAGATC 1183 

TGATCAAGAG ACAGGATGAG GATCGTTTCG C ATG ATT GAA CAA GAT GGA TTG 1235 

Met lie Glu Gin Asp Giy Leu 
1 5 

CAC GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC 1283 
His Ala Giy Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Giy Tyr Asp 
10 15 20 

TGG GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG 1331 
Trp Ala Gin Gin Thr lie Gly Cys Ser Asp Ala Ala Val Phe Arg Leu 
25 30 35 

TCA GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT 137 9 

Ser Ala Gin Giy Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Giy 
^0 45 50 55 

GCC CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC 14 27 

Ala Leu Asn Glu Leu Gin Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala 

6.0 _e3. . _ 70 
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ACG ACG GGC GTT CCT TGC GCA GCT GTG CTC GAG GTT GTC ACT GAA GCG 
Thr Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val Thr Glu Ala 
75 80 85 



1475 



GGA AGG GAG TGG CTG CTA TTG GGC GAA GTG COG GGG GAG GAT CTC CTG 
Gly Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gin Asp Leu Leu 
90 95 100 



1523 



TCA TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA 
Ser Ser His Leu Ala Pro Ala Glu Lys Val Ser He Met Ala Asp Ala 
105 110 115 



1571 



ATG CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC 
Met Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His 
120 125 no 135 _ 



1619 



AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT 1667 
Lys His Arg lie Glu Arg Ala Arg Thr Arg Met Glu Ala Gly 
140 145 150- 

GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA 1715 
Asp Gin Asp Asp Leu Asp Glu Glu His Gin Gly Leu Ala Pro 
155 160 165 




CTT GTC 
Leu Val 



GCC GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT 
Ala Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp 
170 175 180 



1763 



CTC GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA 
Leu Val Val Thr His Gly Asp Ala Cys Leu Pro Asn He Met Val Glu 
185 190 195 



1811 



AAT GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG 
Asn Gly Arg Phe Ser Gly Phe He Asp Cys Gly Arg Leu Gly Val Ala 
200 205 210 215 



1859 




GAC CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG 1907 

Asp Arg Tyr Gin Asp He Ala Leu Ala Thr Arg Asp He Ala Glu Glu 
220 225 230 

CTT GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC 1955 

Leu Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly He Ala 
235 240 245 



GCT CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC 
Ala Pro Asp Ser Gin Arg He Ala Phe Tyr Arg Leu Leu Asp Glu Phe 
250 255 260 



2003 



TTC TGA 

Phe 

264 



GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC 



CG GCC CAG 
Ala Gin 
421 



2057 



CGC GTC GAT TCG GGC ATT TGC CAT ATC AAT GGA CCG ACT GTG CAT GAC 
Arg Val Asp Ser Gly He Cys His He Asn Gly Pro Thr Val His Asp 
425 430 435 



2105 



HR 199 
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GAG GCT GAG ATG CCA TTC GGT GGG GTG AAG TCC AGC GGC TAG GGC AGC 2153 

Glu Ala Gin Met Pro Phe Gly Gly Val Lys Ser Ser Gly Tyr Gly Ser 

440 445 450 

TTC GGC ACT CGA GCA TCG ATT GAG CAC TTT ACC CAG CTG CGC TGG CTG 2201 

Phe Gly Ser Arg Ala Ser lie Glu His Phe Thr Gin Leu Arg Trp Leu 
455 460 465 470 

ACC ATT CAG AAT GGC CCG CGG CAC TAT CCA ATC TAA ATCGATCTTC 224 7 

Thr He Gin Asn Gly Pro Arg His Tyr Pro He 





475 


480 481 








GGGCGCCGCG 

ArAnACCTCT 


GGCATCATGC 
TCTCrnCTCT 


CCGCGGCGCT CGCCTCATTT 
TGGTGGATPn narzrri^nTrn 


CAATCTCTAA 


CTTGATAAAA 
CGAAGAGGAG 


2307 
2367 


AGTACAGTGA 


ACGCCGAGTC 


CACATTGCAA CCGCAGGCAT 


CATCATGCTC 


TGCTCAGCCA 


2427 


^^^^^^ CGCTACCGCA 


GTGTGTCGAT 


TGGTCATCCT CCGGTTGAGG 


TTACGCAAGA 


CGCTGGAGGT 


2487 


I^^^V ATTGTCCGGA 


TGCGTTCTCT 


CGAGGCGCTT CTTCCCTTCC 


CGGGTGGAAT 


TC 


2539 



FIG. 2m: 
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GAATTCCAAT AATGACAATA ATGAGGAGTG CCCA ATG TTT CAC GTG CCC CTG CTT 

Met Phe His Val Pro Leu Leu 
1 5 



55 



ATT GGT GGT AAG CCT TGT TCA GCA TCT GAT GAG CGC ACC TTC GAG CGT 
lie Gly Gly Lys Pro Cys Ser Ala Ser Asp Glu Arg Thr Phe Glu Arg 
10 15 20 



103 



CGT AGC CCG CTG ACC GGA GAA GTG GTA TCG CGC GTC GCT GCT GCC AGT 
Arg Ser Pro Leu Thr Gly Glu Val Val Ser Arg Val Ala Ala Ala Ser 
25 30 35 



151 



TTG GAA GAT GCG GAC GCC GCA GTG GCC GCT GCA CAG GCT GCG TTT CCT 
Leu Glu Asp Ala Asp Ala Ala Val Ala Ala Ala Gin Ala Ala Phe Pro 
40 43 50 55 



199 



GAA TGG GCG GCG CTT GCT CCG AGC GAA CGC CGT GCC CGA CTG CTG CGA 24 7 

Glu Trp Ala Ala Leu Ala Pro Ser Glu Arg Arg Ala Arg Leu Leu Arg 
60 65 70 

GCG GCG GAT CTT CTA GAG GAC CGT TCT TCC GAG TTC ACC GCC GCA GCG 295 
Ala Ala Asp Leu Leu Glu Asp Arg Ser Ser Glu Phe Thr Ala Ala Ala 
75 80 85 



AGT GAA ACT GGC GCA GCG GGA AAC TGG TAT GGG TTT AAC GTT TAG CTG 
Ser Glu Thr Gly Ala Ala Gly Asn Trp Tyr Gly Phe Asn Val Tyr Leu 
90 95 100 



343 



GCG GCG GGC ATG TTG CGG GAA GCC GCG GCC ATG ACC ACA CAG ATT CAG 
Ala Ala Gly Met Leu Arg Glu Ala Ala Ala Met Thr Thr Gin He Gin 
105 110 115 



391 



GGC GAT GTC ATT CCG TCC AAT GTG CCC GGT AGC TTT GCC ATG GCG GTT 
Gly Asp Val He Pro Ser Asn Val Pro Gly Ser Phe Ala Met Ala Val 
120 125 130 135 



439 




CGA CAG CCA TGT GGC GTG GTG CTC GGT ATT GCG CCT TGG AAT GCT CCG 4 87 

Arg Gin Pro Cys Gly Val Val Leu Gly He Ala Pro Trp Asn Ala Pro 
140 145 150 

GTA ATC CTT GGC GTA CGG GCT GTT GCG ATG CCG TTG GCA TGC GGC AAT 535 
Val He Leu Gly Val Arg Ala Val Ala Met Pro Leu Ala Cys Gly Asn 
155 160 165 



ACC GTG GTG TTG AAA AGC TCT GAG CTG AGT CCC TTT ACC CAT CGC CTG 
Thr Val Val Leu Lys Ser Ser Glu Leu Ser Pro Phe Thr His Arg Leu 
170 175 180 



583 



ATT GGT CAG GTG TTG CAT GAT GCT GGT CTG GGG GAT GGC GTG GTG AAT 
He Gly Gin Val Leu His Asp Ala Gly Leu Gly Asp Gly Val Val Asn 
185 190 195 



631 



GTC ATC AGC AAT GCC CCG CAA GAC GCT CCT GCG GTG GTG GAG CGA CTG 
Val He Ser Asn Ala Pro Gin Asp Ala Pro Ala Val Val Glu Arg Leu 
200 205 210 215 



679 



HR 199 
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ATT GCA AAT CCT GCG GTA CGT CGA GTG AAC TTC ACC GGT TCG ACC CAC 727 
lie Ala Asn Pro Ala Val Arg Arg Val Asn Phe Thr Gly Ser Thr His 
220 225 230 

GTT GGA CGG ATC ATT GGT GAG CTG TCT GCG CGT CAT CTG AAG CCT GCT 77 5 

Val Gly Arg lie lie Gly Glu Leu Ser Ala Arg His Leu Lys Pro Ala 
235 240 245 

GTG CTG GAA TTA GGT GGT AAG GCT CCG TTC TTG GTC TTG GAC GAT GCC 823 
Val Leu Glu Leu Gly Gly Lys Ala Pro Phe Leu Val Leu Asp Asp Ala 
250 255 260 

GAC CTC GAT GCG GCG GTC GAA GCG GCG GCC TTT GGT GCC TAC TTC AAT 871 
Asp Leu Asp Ala Ala Val Glu Ala Ala Ala Phe Gly Ala Tyr Phe Asn 

'? r.^ , ?ia 275 _ 

CAG GGT CAA ATC TGC ATG TCC ACT GAG CGT CTG ATT GTG ACA GCA GTC 919 
Gin Gly Gin He Cys Met Ser Thr Glu Arg Leu He Val Thr Ala Val 
280 285 290 295 

GCA GAC GCC TTT GTT GAA AAG CTG GCG AGG AAG GTC GCC ACA CTG CGT 967 
Ala Asp Ala Phe Val Glu Lys Leu Ala Arg Lys Val Ala Thr Leu Arg 
300 305 310 

GCT GGC GAT CCT AAT GAT CCG CAA TCG GTC TTG GGT TCG TTG ATT GAT 1015 
Ala Gly Asp Pro Asn Asp Pro Gin Ser Val Leu Gly Ser Leu He Asp 
315 320 325 

GCC AAT GCA GGT CAA CGC ATC CAG GTGGGGAGAG GCGGTTTGCG TATTGGGCGC 1069 
Ala Asn Ala Gly Gin Arg He Gin 
330 335 

ATGCATAAAA ACTGTTGTAA TTCATTAAGC ATTCTGCCGA CATGGAAGCC ATCACAAACG 112 9 

GCATGATGAA CCTGAATCGC CAGCGGCATC AGCACCTTGT CGCCTTGCGT ATAATATTTG 118 9 

CCCATGGACG CACACCGTGG AAACGGATGA AGGCACGAAC CCAGTTGACA TAAGCCTGTT 124 9 

CGGTTCGTAA ACTGTAATGC AAGTAGCGTA TGCGCTCACG CAACTGGTCC AGAACCTTGA 1309 

CCGAACGCAG CGGTGGTAAC GGCGCAGTGG CGGTTTTCAT GGCTTGTTAT GACTGTTTTT 13 69 

TTGTACAGTC TATGCCTCGG GCATCCAAGC AGCAAGCGCG TTACGCCGTG GGTCGATGTT 14 2 9 

TGATGTTATG GAGCAGCAAC G ATG TTA CGC AGC AGC AAC GAT GTT ACG CAG 14 80 

Met Leu Arg Ser Ser Asn Asp Val Thr Gin 
15 10 

CAG GGC AGT CGC CCT AAA ACA AAG TTA GGT GGC TCA AGT ATG GGC ATC 1528 
Gin Gly Ser Arg Pro Lys Thr Lys Leu Gly Gly Ser Ser Met Gly He 
15 20 25 

ATT CGC ACA TGT AGG CTC GGC CCT GAC CAA GTC AAA TCC ATG CGG GCT 157 6 

He Arg Thr Cys Arg Leu Gly Pro Asp Gin Val Lys Ser Met Arg Ala 

-30 35 _ 40 
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GCT CTT GAT CTT TTC GOT CGT GAG TTC GGA GAC GTA GCC ACC TAG TCC 
Ala Leu Asp Leu Phe Gly Arg Glu Phe Gly Asp Val Ala Thr Tyr Ser 
45 50 55 



1624 



CAA CAT GAG COG GAC TCC GAT TAG CTC GGG AAC TTG CTC CGT AGT AAG 
Gin His Gin Pro Asp Ser Asp Tyr Leu Gly Asn Leu Leu Arg Ser Lys 
60 65 70 



1672 



ACA TTC ATC GCG CTT GCT GCC TTC GAC CAA GAA GCG GTT GTT GGC GCT 
Thr Phe He Ala Leu Ala Ala Phe Asp Gin Glu Ala Val Val Gly Ala 
75 80 85 90 



1720 



CTC GCG GCT TAC GTT CTG CCC AGG TTT GAG CAG GCG CGT AGT GAG ATC 
Leu Ala Ala Tyr Val Leu Pro Arg Phe Glu Gin Pro Arg Ser Glu He 
^5 100 105 



1768 



TAT ATC TAT GAT CTC GCA GTC TCC GGC GAG CAC CGG AGG CAG GGC ATT 1816 
Tyr He Tyr Asp Leu Ala Val Ser Gly Glu His Arg Arg Gin Gly He 
110 115 120 

GCC ACC GCG CTC ATC AAT CTC CTC AAG CAT GAG GCC AAC GCG CTT GGT 1864 
Ala Thr Ala Leu He Asn Leu Leu Lys His Glu Ala Asn Ala Leu Gly 
125 130 135 



GCT TAT GTG ATC TAC GTG CAA GCA GAT TAC GGT GAC GAT CCC GCA GTG 
Ala Tyr Val He Tyr Val Gin Ala Asp Tyr Gly Asp Asp Pro Ala Val 
140 145 150 



1912 



GCT CTC TAT ACA AAG TTG GGC ATA CGG GAA GAA GTG ATG CAC TTT GAT 
Ala Leu Tyr Thr Lys Leu Gly He Arg Glu Glu Val Met His Phe Asp 
155 160 165 170 



1960 



ATC GAC CCA AGT ACC GCC ACC TAA CAATTCGTTC AAGCCGAGAT CGGCTTCCCA 
He Asp Pro Ser Thr Ala Thr 
175 177 



2014 




A TTG GCC CAG CGC GTC GAT TCG GGC ATT TGC CAT ATC AAT GGA CCG ACT 2063 
Leu Ala Gin Arg Val Asp Ser Gly He Cys His He Asn Gly Pro Thr 
420 425 430 435 

GTG CAT GAC GAG GCT CAG ATG CCA TTC GGT GGG GTG AAG TCC AGC GGC 2111 
Val His Asp Glu Ala Gin Met Pro Phe Gly Gly Val Lys Ser Ser Gly 
440 445 450 



TAC GGC AGC TTC GGC AGT CGA GCA TCG ATT GAG CAC TTT ACC CAG CTG 
Tyr Gly Ser Phe Gly Ser Arg Ala Ser He Glu His Phe Thr Gin Leu 
455 460 465 



2159 



CGC TGG CTG ACC ATT CAG AAT GGC CCG CGG CAC TAT CCA ATC TAA 
Arg Trp Leu Thr He Gin Asn Gly Pro Arg His Tyr Pro He 
470 475 480 481 



2204 



ATCGATCTTC GGGCGCCGCG GGCATCATGC CCGCGGCGCT CGCCTCATTT CAATCTCTAA 22 64 
CTTGATAAAA ACAGAGCTGT TCTCCGGTCT TGGTGGATCA AGGCCAGTCG CGGAGAGTCT 2324 
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CGAAGAGGAG AGTACAGTGA ACGCCGAGTC CACATTGCAA CCGCAGGCAT CATCATGCTC 2384 

TGCTCAGCCA CGCTACCGCA GTGTGTCGAT TGGTCATCCT CCGGTTGAGG TTACGCAAGA 24 4 4 

CGCTGGAGGT ATTGTCCGGA TGCGTTCTCT CGAGGCGCTT CTTCCCTTCC CGGGTGGAAT 2504 

TC 2506 
FIG. 2n: 
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GAATTCCAAT AATGACAATA ATGAGGAGTG CCCA ATG TTT CAC GTG CCC CTG CTT 55 

Met Phe His Val Pro Leu Leu 

1 5 

ATT GGT GGT AAG CCT TGT TCA GCA TCT GAT GAG CGC ACC TTC GAG CGT 103 

lie Gly Gly Lys Pro Cys Ser Ala Ser Asp Glu Arg Thr Phe Glu Arg 

10 15 20 

CGT AGC CCG CTG ACC GGA GAA GTG GTA TCG CGC GTC GCT GCT GCC AGT 151 

Arg Ser Pro Leu Thr Gly Glu Val Val Ser Arg Val Ala Ala Ala Ser 

25 30 35 

TTG GAA GAT GCG GAC GCC GCA GTG GCC GCT GCA CAG GCT GCG TTT CCT 199 

Leu Glu Asp Ala Asp Ala Ala Val Ala Ala Ala Gin Ala Ala Phe Pro 

40 4,^ 50 55 

GAA TGG GCG GCG CTT GCT CCG AGC GAA CGC CGT GCC CGA CTG CTG CGA 24 7 

Glu Trp Ala Ala Leu Ala Pro Ser Glu Arg Arg Ala Arg Leu Leu Arg 

60 65 70 

GCG GCG GAT CTT CTA GAG GAC CGT TCT TCC GAG TTC ACC GCC GCA GCG 295 

Ala Ala Asp Leu Leu Glu Asp Arg Ser Ser Glu Phe Thr Ala Ala Ala 

75 80 85 

AGT GAA ACT GGC GCA GCG GGA AAC TGG TAT GGG TTT AAC GTT TAC CTG 34 3 

Ser Glu Thr Gly Ala Ala Gly Asn Trp Tyr Gly Phe Asn Val Tyr Leu 

90 95 100 

GCG GCG GGC ATG TTG CGG GAA GCC GCG GCC ATG ACC ACA CAG ATT CAG 391 

Ala Ala Gly Met Leu Arg Glu Ala Ala Ala Met Thr Thr Gin He Gin 

105 110 115 

GGC GAT GTC ATT CCG TCC AAT GTG CCC GGT AGC TTT GCC ATG GCG GTT 4 39 

Gly Asp Val He Pro Ser Asn Val Pro Gly Ser Phe Ala Met Ala Val 

120 125 130 135 

CGA CAG CCA TGT GGC GTG GTG CTC GGT ATT GCG CCT TGG AAT GCT CCG 4 87 

Arg Gin Pro Cys Gly Val Val Leu Gly He Ala Pro Trp Asn Ala Pro 

140 145 150 

GTA ATC CTT GGC GTA CGG GCT GTT GCG ATG CCG TTG GCA TGC GGC AAT 535 

Val He Leu Gly Val Arg Ala Val Ala Met Pro Leu Ala Cys Gly Asn 

155 160 165 

ACC GTG GTG TTG AAA AGC TCT GAG CTG AGT CCC TTT ACC CAT CGC CTG 583 

Thr Val Val Leu Lys Ser Ser Glu Leu Ser Pro Phe Thr His Arg Leu 

170 175 180 

ATT GGT CAG GTG TTG CAT GAT GCT GGT CTG GGG GAT GGC GTG GTG AAT 631 

He Gly Gin Val Leu His Asp Ala Gly Leu Gly Asp Gly Val Val Asn 

185 190 195 

GTC ATC AGC AAT GCC CCG CAA GAC GCT CCT GCG GTG GTG GAG CGA CTG 67 9 

Val He Ser Asn Ala Pro Gin Asp Ala Pro Ala Val Val Glu Arg Leu 

200 205 210 215 
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ATT GCA AAT CCT GCG GTA CGT CGA GTG AAC TTC ACC GGT TCG ACC CAC 727 

lie Ala Asn Pro Ala Val Arg Arg Val Asn Phe Thr Gly Ser Thr His 

220 225 230 

GTT GGA CGG ATC ATT GGT GAG CTG TCT GCG CGT CAT CTG AAG CCT GCT 77 5 

Val Gly Arg lie lie Gly Glu Leu Ser Ala Arg His Leu Lys Pro Ala 
235 240 245 

GTG CTG GAA TTA GGT GGT AAG GCT CCG TTC TTG GTC TTG GAC GAT GCC 823 

Val Leu Glu Leu Gly Gly Lys Ala Pro Phe Leu Val Leu Asp Asp Ala 

250 255 260 

GAC CTC GAT GCG GCG GTC GAA GCG GCG GCC TTT GGT GCC TAG TTC AAT 871 

Asp Leu Asp Ala Ala Val Glu Ala Ala Ala Phe Gly Ala Tyr Phe Asn 

"7^ 





CAG GGT CAA ATC TGC ATG TCC ACT GAG CGT CTG ATT GTG ACA GCA GTC 919 
Gin Gly Gin lie Cys Met Ser Thr Glu Arg Leu lie Val Thr Ala Val 
280 285 290 295 

GCA GAC GCC TTT GTT GAA AAG CTG GCG AGG AAG GTC GCC ACA CTG CGT 967 
Ala Asp Ala Phe Val Glu Lys Leu Ala Arg Lys Val Ala Thr Leu Arg 
300 305 310 

GCT GGC GAT CCT AAT GAT CCG CAA TCG GTC TTG GGT TCG TTG ATT GAT 1015 
Ala Gly Asp Pro Asn Asp Pro Gin Ser Val Leu Gly Ser Leu lie Asp 
315 320 325 

GCC AAT GCA GGT CAA CGC ATC CAG GTT CTG GTC GAT GAT GCG CTC GCA 1063 
Ala Asn Ala Gly Gin Arg lie Gin Val Leu Val Asp Asp Ala Leu Ala 
330 335 340 

AAA GGC GCG CAATGGAA TTG GCC CAG CGC GTC GAT TCG GGC ATT TGC CAT 1113 
Lys Gly Ala Leu Ala Gin Arg Val Asp Ser Gly lie Cys His 

345 346 420 425 430 

ATC AAT GGA CCG ACT GTG CAT GAC GAG GCT CAG ATG CCA TTC GGT GGG 1161 
lie Asn Gly Pro Thr Val His Asp Glu Ala Gin Met Pro Phe Gly Gly 
435 440 445 

GTG AAG TCC AGC GGC TAG GGC AGC TTC GGC AGT CGA GCA TCG ATT GAG 1209 
Val Lys Ser Ser Gly Tyr Gly Ser Phe Gly Ser Arg Ala Ser lie Glu 
450 455 460 

CAC TTT ACC CAG CTG CGC TGG CTG ACC ATT CAG AAT GGC CCG CGG CAC 1257 
His Phe Thr Gin Leu Arg Trp Leu Thr He Gin Asn Gly Pro Arg His 
465 470 475 

TAT CCA ATC TAA ATCGATCTTC GGGCGCCGCG GGCATCATGC CCGCGGCGCT 130 9 
Tyr Pro He 
480 481 

CGCCTCATTT CAATCTCTAA CTTGATAAAA ACAGAGCTGT TCTCCGGTCT TGGTGGATCA 1369 

AGGCCAGTCG CGGAGAGTCT CGAAGAGGAG AGTACAGTGA ACGCCGAGTC CACATTGCAA 14 2 9 



HR 199 
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CCGCAGGCAT CATCATGCTC TGCTCAGCCA CGCTACCGCA GTGTGTCGAT TGGTCATCCT 14 89 
CCGGTTGAGG TTACGCAAGA CGCTGGAGGT ATTGTCCGGA TGCGTTCTCT CGAGGCGCTT 154 9 
CTTCCCTTCC CGGGTGGAAT TC 1571 
FIG. 2o: 
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GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 

GTGACGAGGC CACACT GTG AGT TGG TCA GGG GGG GCT TAG TOG GCG TTT TCC 112 
Met Ser Trp Ser Gly Gly Ala Tyr Ser Ala Phe Ser 
1 5 10 

GAG ACT GCG TTG GTT GCG GCA GTG CGC ACC CCC TGG ATT GAT TGC GGG 160 
Asp Thr Ala Leu Val Ala Ala Val Arg Thr Pro Trp lie Asp Cys Gly 
15 20 25 

GGT GCC CTG TCG CTG GTG TCG CCT ATC GAC TTA GGG GTA AAG GTG GCT 208 
Gly Ala Leu Ser Leu Val Ser Pro lie Asp Leu Gly Val Lys Val Ala 
30 35 40 

nnri HTT "^T^ mTH ^^"^ ^^^ C. TCG CTT ^^^^ ^aa ^Tr: nTC. nAT jxnc PSf^ 

Arg Glu Val Leu Met Arg Ala Ser Leu Glu Pro Gin Met Val Asp Ser 
45 50 55 60 

GTA CTC GCA GGC TCT ATG GCT CAA GCA AGC TTT GAT GCT TAG CTG CTC 304 
Val Leu Ala Gly Ser Met Ala Gin Ala Ser Phe Asp Ala Tyr Leu Leu 
65 70 75 

GCG CGG CAC ATT GGC TTG TAC AGC GGT GTT CCC AAG TCG GTT CCG GCC 352 
Pro Arg His lie Gly Leu Tyr Ser Gly Val Pro Lys Ser Val Pro Ala 
80 85 90 

TTG GGG GTG CAG CGC ATT TGC GGC ACA GGC TTC GAA CTG CTT CGG GAG 4 00 

Leu Gly Val Gin Arg lie Cys Gly Thr Gly Phe Glu Leu Leu Arg Gin 
95 100 105 

GCC GGC GAG CAG ATT TCC CAA GGC GCT GAT CAC GTG CTG TGT GTG GCG 44 8 

Ala Gly Glu Gin lie Ser Gin Gly Ala Asp His Val Leu Cys Val Ala 
110 115 120 

GCA GAG TCC ATG TCG CGT AAC CCC ATC GCG TCG TAT ACA CAC CGG GGC 4 96 

Ala Glu Ser Met Ser Arg Asn Pro lie Ala Ser Tyr Thr His Arg Gly 
125 130 135 140 

GGG TTC CGC CTC GGT GCG CCC GTT GAG TTC AAG GAT TTT TTG TGG GAG 54 4 

Gly Phe Arg Leu Gly Ala Pro Val Glu Phe Lys Asp Phe Leu Trp Glu 
145 150 155 

GCA TTG TTT GAT CCT GCT CCA GGA CTC GAC ATG ATC GCT ACC GCA GAA 5 92 

Ala Leu Phe Asp Pro Ala Pro Gly Leu Asp Met lie Ala Thr Ala Glu 
160 165 170 

AAC CTG GGGACAGCAA GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT 64 8 

Asn Leu 
174 

TGGGAAGCCC TGCAAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GATGGCGCAG 7 08 

GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGC ATG ATT GAA CAA 7 63 

Met lie Glu Gin 
1 
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GAT GGA 
Asp Gly 
5 



TTG CAC GCA 
Leu His Ala 



GGT TCT 
Gly Ser 
10 



CCG GCC GCT 
Pro Ala Ala 



TGG GTG GAG AGG CTA TTC 
Trp Val Glu Arg Leu Phe 
15 20 



811 



GGC TAT GAG TGG GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG 
Gly Tyr Asp Trp Ala Gin Gin Thr He Gly Cys Ser Asp Ala Ala Val 
25 30 35 



859 



TTC CGG 
Phe Arg 



CTG TCA GCG 
Leu Ser Ala 
40 



CAG GGG 
Gin Gly 



CGC CCG GTT 
Arg Pro Val 
45 



CTT TTT GTC AAG ACC GAC 
Leu Phe Val Lys Thr Asp 
50 



907 



CTG TCC 
Leu Ser 



GGT GCC CTG 
Gly Ala Leu 
55 



AAT GAA 
Asn Glu 



CTG CAG GAC 
Leu Gin Asp 
■ 60 



GAG GCA GCG CGG CTA TCG 
Glu Ala Ala Arg Leu Ser 
£5 



955 




TGG CTG 
Trp Leu 
70 

ACT GAA 
Thr Glu 
85 



GCC ACG ACG 
Ala Thr Thr 



GCG GGA AGG 
Ala Gly Arg 



GGC GTT 
Gly Val 
75 

GAC TGG 
Asp Trp 
90 



CCT TGC GCA 
Pro Cys Ala 



CTG CTA TTG 
Leu Leu Leu 



GCT GTG 
Ala Val 
80 

GGC GAA 
Gly Glu 
95 



CTC GAC GTT GTC 
Leu Asp Val Val 



GTG CCG GGG CAG 
Val Pro Gly Gin 
100 



1003 



1051 



GAT CTC 
Asp Leu 



CTG TCA TCT 
Leu Ser Ser 
105 



CAC CTT 
His Leu 



GCT 
Ala 



CCT GCC 
Pro Ala 
110 



GAG AAA 
Glu Lys 



GTA TCC 
Val Ser 



ATC ATG 
He Met 
115 



1099 



GCT GAT 
Ala Asp 



GCA ATG CGG 
Ala Met Arg 
120 



CGG CTG 
Arg Leu 



CAT 
His 



ACG CTT 
Thr Leu 
125 



GAT CCG 
Asp Pro 



GCT ACC 
Ala Thr 
130 



TGC CCA 
Cys Pro 



1147 



TTC GAC 
Phe Asp 



CAC CAA GCG 
His Gin Ala 
135 



AAA CAT 
Lys His 



CGC 
Arg 
140 



ATC GAG 
He Glu 



CGA GCA 
Arg Ala 



CGT ACT 
Arg Thr 
145 



CGG ATG 
Arg Met 



1195 




GAA GCC 
Glu Ala 
150 

CTC GCG 
Leu Ala 
165 



GGT CTT GTC 
Gly Leu Val 



CCA GCC GAA 
Pro Ala Glu 



GAT CAG 
Asp Gin 
155 

CTG TTC 
Leu Phe 
170 



GAT 
Asp 



GAT CTG 
Asp Leu 



GCC AGG CTC 
Ala Arg Leu 



GAC GAA 
Asp Glu 
160 

AAG GCG 
Lys Ala 
175 



GAG CAT 
Glu His 



CGC ATG 
Arg Met 



CAG GGG 
Gin Gly 



CCC GAC 
Pro Asp 
180 



1243 



1291 



GGC GAG 
Gly Glu 



GAT CTC GTC 
Asp Leu Val 
185 



GTG ACC 
Val Thr 



CAT GGC GAT 
His Gly Asp 
190 



GCC TGC 
Ala Cys 



TTG CCG 
Leu Pro 



AAT ATC 
Asn He 
195 



1339 



ATG GTG 
Met Val 



GAA AAT GGC 
Glu Asn Gly 
200 



CGC TTT 
Arg Phe 



TCT GGA TTC 
Ser Gly Phe 
205 



ATC GAC 
He Asp 



TGT GGC 
Cys Gly 
210 



CGG CTG 
Arg Leu 



1387 



GGT GTG 
Gly Val 



GCG GAC CGC 
Ala Asp Arg 
215 



TAT CAG 
Tyr Gin 



GAC ATA GCG 
Asp He Ala 

220 ^ 



TTG GCT 
Leu Ala 



ACC CGT 
Thr Arg 
225 



GAT ATT 
Asp He 



1435 
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GCT GAA GAG CTT GGC GGC GAA TGG GCT GAG CGC TTC CTC GTG CTT TAG 
Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr 
230 235 240 



1483 



GGT ATC GGC GCT CCC GAT TCG GAG CGC ATC GCC TTC TAT CGC CTT CTT 
Gly lie Ala Ala Pro Asp Ser Gin Arg lie Ala Phe Tyr Arg Leu Leu 
245 250 255 260 



1531 



GAC GAG TTC TTC TGA GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC 
Asp Glu Phe Phe 
264 



1586 



CA TTG AGG GCG CAA GAG GAG AAA TGG ATT GAC CAA GAG ATC GTG GCT 
Leu Arg Ala Gin Glu Glu Lys Trp lie Asp Gin Glu lie Val Ala 
1 Q 7 TT t n one; 



1633 



GTT ACG 
Val Thr 



GAA CTG 
Glu Leu 



GAT GAA GAG 
Asp Glu Gin 

.215 

GCT CGG AAG 
Pro Arg Lys 
230 



TTC GAT 
Phe Asp 



GCA AAA 
Ala Lys 



TTA GAG 
Leu Glu 
220 

TTG TTG 
Leu Leu 
235 



GGC TAG AAC AGT 
Gly Tyr Asn Ser 



ATC 
He 



GTG ACA GTC 
Val Thr Val 
240 



CGA GCA ATT 
Arg Ala lie 
225 

ATC CGC GGC 
He Arg Gly 



1681 



1729 



CTA GCA 
Leu Ala 
245 



GTC TTT GAA 
Val Phe Glu 



GCC CTT 
Ala Leu 
250 



TCC CGA 
Ser Arg 



TTG 
Leu 



AAG COT GTT 
Lys Pro Val 
255 



CAT TCT GGC 
His Ser Gly 



1777 



GGG GTG 
Gly Val 
260 



CAG ACT GCG 
Gin Thr Ala 



GGC AAC 
Gly Asn 
265 



AGC TGT 
Ser Cys 



GCC 
Ala 



GTA GTG GAC 
Val Val Asp 
270 



GGC GCC GCG 
Gly Ala Ala 
275 



1825 



GCG GCT 
Ala Ala 



TTG 
Leu 



GTG GCT 
Val Ala 
280 



CGA GAG 
Arg Glu 



TCG TCT 
Ser Ser 



GCG 
Ala 
285 



ACA CAG GCG 
Thr Gin Pro 



GTC TTG GCT 
Val Leu Ala 
290 



1873 




AGG ATA 
Arg He 



CTC GGC 
Leu Gly 



CTG 
Leu 



GCT 
Pro 
310 



GCT ACC 
Ala Thr 
295 

GCG CCC 
Ala Pro 



TCC GTA 
Ser Val 



GCG ATT 
Ala He 



GTC GGG 
Val Gly 
300 

CGC CTG 
Arg Leu 
315 



ATC 
He 



GAG CCC GAG 
Glu Pro Glu 



CTG CTT GCG CGT 
Leu Leu Ala Arg 
320 



CAT ATG GGG 
His Met Gly 
305 

AGT GAT CTT 
Ser Asp Leu 



1921 



1969 



AGT TTG AGG GAT ATC GAC CTC TTT GAG ATA AAC GAG GCG 
Ser Leu Arg Asp He Asp Leu Phe Glu He Asn Glu Ala 
325 330 335 



CAG GCC GCC 
Gin Ala Ala 



2017 



CAA GTT CTA GCG GTA CAG CAT GAA TTG GGT ATT GAG CAC TCA AAA CTT 
Gin Val Leu Ala Val Gin His Glu Leu Gly He Glu His Ser Lys Leu 
340 345 350 355 



2065 



AAT 
Asn 



ATT 
He 



TGG GGC GGG 
Trp Gly Gly 

3-60- 



GCC ATT 
Ala He 



GCA CTT GGA CAC CCG CTT 
Ala Leu Gly His Pro Leu 
-365 



GCC GCG ACC 
Ala Ala Thr 

370 - 



2113 



HR 199 



-78- 



GGA TTG CGT CTC 
Gly Leu Arg Leu 
375 

TTT CGA TAT GGA 
Phe Arg Tyr Gly 
390 

GCG GTT CTT TTA 
Ala Val Leu Leu 
405 

TCG ATG ATT AAC 
Ser Met lie Asn 



TGC ATG 
Cys Met 



ATT GCC 
lie Ala 



GAG AAT 
Glu Asn 



AGA GTT 
Arg Val 



ACC CTC 
Thr Leu 



TCG GCA 
Ser Ala 
395 

CCC CAC 
Pro His 
410 

GAC CAC 
Asp His 



GCT CAC CAA 
Ala His Gin 
380 

TGC ATT GGT 
Cys lie Gly 



TTC GGT TCG 
Phe Gly Ser 



TAT CCA CTG 
Tyr Pro Leu 



TTG 
Leu 



GGG 
Gly 



TCC 
Ser 
415 

AGC 
Ser 



CAA GCT AAT AAC 
Gin Ala Asn Asn 
385 

GGA CAG GGG ATG 
Gly Gin Gly Met 
400 

TCT GCA CGA AGT 
Ser Ala Arg Ser 



TAA CGGGCATCTC 



2161 



2209 



2257 



2306 




CTTTGTTGCT TTGAGGTGGC GCACGAAGGA GGGCTCGAAA ATCTCTGCTA AAAACAAGAA 
GAAGGAACAG GGAACATGAT TAGTTTCGCT CGTATGGCAG AAAGTTTAGG AGTCCAGGCT 
AAACTTGCCC TTGCCTTCGC ACTCGTATTA TGTGTCGGGC TGATTGTTAC CGGCACGGGT 
TTCTACAGTG TACATACCTT GTCAGGGTTG GTGGGAATTC 
FIG. 2p: 



2366 
2426 
2486 
2526 



HR 199 



-79- 



GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 

GTGACGAGGC CACACT GTG AGT TGG TCA GGG GGG GCT TAG TOG GCG TTT TOO 112 
Met Ser Trp Ser Gly Gly Ala Tyr Ser Ala Phe Ser 
15 10 

GAG ACT GCG TTG GTT GCG GCA GTG CGC ACC CCC TGG ATT GAT TGC GGG 160 
Asp Thr Ala Leu Val Ala Ala Val Arg Thr Pro Trp He Asp Cys Gly 
15 20 25 



GGT GCC CTG TCG CTG GTG TCG CCT ATC GAC TTA GGG GTA AAG GTC GCT 
Gly Ala Leu Ser Leu Val Ser Pro He Asp Leu Gly Val Lys Val Ala 
30 35 40 



208 




rnr lynri gtt ctc ^tM^^t^^^^s^ (juu tuu utt Ui'y^i cca ui\A mo GTg -ca^-aOG" 

Arg Glu Val Leu Met Arg Ala Ser Leu Glu Pro Gin Met Val Asp Ser 

45 50 55 60 

GTA CTC GCA GGC TCT ATG GCT CAA GCA AGC TTT GAT GCT TAG CTG CTG 

Val Leu Ala Gly Ser Met Ala Gin Ala Ser Phe Asp Ala Tyr Leu Leu 

65 70 75 

CCG CGG CAC ATT GGC TTG TAG AGC GGT GTT CCC AAG TCG GTT CCG GCC 

Pro Arg His He Gly Leu Tyr Ser Gly Val Pro Lys Ser Val Pro Ala 

80 85 90 



304 



352 




TTG GGG GTG CAG CGC ATT TGC GGC ACA GGC TTC GAA CTG GTT CGG CAG 

Leu Gly Val Gin Arg He Cys Gly Thr Gly Phe Glu Leu Leu Arg Gin 

95 100 105 

GCC GGC GAG CAG ATT TGC CAA GGC GCT GAT CAC GTG CTG TGT GTC GCG 

Ala Gly Glu Gin He Ser Gin Gly Ala Asp His Val Leu Cys Val Ala 

110 115 120 

GCA GAG TCC ATG TCG CGT AAC CCC ATC GCG TCG TAT ACA CAC CGG GGC 

Ala Glu Ser Met Ser Arg Asn Pro He Ala Ser Tyr Thr His Arg Gly 

125 130 135 140 

GGG TTC CGC CTC GGT GCG CCC GTT GAG TTC AAG GAT TTT TTG TGG GAG 

'Gly Phe Arg Leu Gly Ala Pro Val Glu Phe Lys Asp Phe Leu Trp Glu 

145 150 155 

GCA TTG TTT GAT CCT GCT CCA GGA CTC GAC ATG ATC GCT ACC GCA GAA 

Ala Leu Phe Asp Pro Ala Pro Gly Leu Asp Met He Ala Thr Ala Glu 

160 165 170 



400 



448 



496 



544 



592 



AAC CTG GGGGAGAGGC GGTTTGCGTA TTGGGCGCAT GCATAAAAAC TGTTGTAATT 
Asn Leu 
174 



648 



CATTAAGCAT TCTGCCGACA TGGAAGCCAT CACAAACGGC ATGATGAACC TGAATCGCCA 7 08 

GCGGCATCAG CACCTTGTCG CCTTGCGTAT AATATTTGCC CATGGACGCA CACCGTGGAA 7 68 

ACGGATGAAG GCACGAACCC AGTTGACATA AGCCTGTTCG GTTCGTAAAC TGTAATGCAA "828 

GTAGCGTATG CGCTCACGCA ACTGGTCCAG AACCTTGACC GAACGCAGCG GTGGTAACGG 888 



HR 199 



-80- 



CGCAGTGGCG GTTTTCATGG CTTGTTATGA CTGTTTTTTT GTACAGTCTA TGCCTCGGGC 94 8 

ATCCAAGC AGCAAGCGCG TTACGCCGTG GGTCGATGTTTG ATGTTATGGA GCAGCAACG 1007 

ATG TTA CGC AGC AGC AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA 1055 
Met Leu Arg Ser Ser Asn Asp Val Thr Gin Gin Gly Ser Arg Pro Lys 
15 10 15 

ACA AAG TTA GGT GGC TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC 1103 
Thr Lys Leu Gly Gly Ser Ser Met Gly lie lie Arg Thr Cys Arg Leu 
20 25 30 

GGC CCT GAC CAA GTC AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT 1151 
Gly Pro Asp Gin Val Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly 



CGT GAG TTC GGA GAC GTA GCC ACC TAG TCC CAA CAT CAG CCG GAC TCC 1199 
Arg Glu Phe Gly Asp Val Ala Thr Tyr Ser Gin His Gin Pro Asp Ser 
50 55 60 

GAT TAC CTC GGG AAC TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT 1247 
Asp Tyr Leu Gly Asn Leu Leu Arg Ser Lys Thr Phe lie Ala Leu Ala 
65 70 75 80 

GCC TTC GAC CAA GAA GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG 12 95 

Ala Phe Asp Gin Glu Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu 
85 90 95 

CCC AGG TTT GAG CAG CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA 134 3 

Pro Arg Phe Glu Gin Pro Arg Ser Glu lie Tyr lie Tyr Asp Leu Ala 
100 105 110 

GTC TCC GGC GAG CAC CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT 1391 
Val Ser Gly Glu His Arg Arg Gin Gly lie Ala Thr Ala Leu lie Asn 
115 120 125 

CTC CTC AAG CAT GAG GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG 14 39 

Leu Leu Lys His Glu Ala Asn Ala Leu Gly Ala Tyr Val lie Tyr Val 
130 135 140 

CAA GCA GAT TAC GGT GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG 1487 
Gin Ala Asp Tyr Gly Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu 
145 150 155 160 

GGC ATA CGG GAA GAA GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC 1535 
Gly lie Arg Glu Glu Val Met His Phe Asp lie Asp Pro Ser Thr Ala 
165 170 175 

ACC TAA CAATTCGTTC AAGCCGAGAT CGGCTTCCCA TTG AGG GCG CAA GAG GAG 1589 
Thr Leu Arg Ala Gin Glu Glu 

177 197 200 

AAA TGG ATT GAC CAA GAG ATC GTG GCT GTT ACG GAT GAA CAG TTC GAT 1637 
Lys Trp lie Asp Gin Glu lie Val Ala Val Thr Asp Glu Gin Phe Asp 

205 210 215 



HR 199 



81 



TTA GAG GGC TAG AAC AGT CGA GCA ATT GAA CTG OCT 
Leu Glu Gly Tyr Asn Ser Arg Ala lie Glu Leu Pro 
220 225 230 



CGG AAG GCA AAA 
Arg Lys Ala Lys 



1685 



TTG TTG ATC GTG ACA GTC ATC CGC GGC CTA GCA GTC 
Leu Leu He Val Thr Val lie Arg Gly Leu Ala Val 
235 240 245 



TTT GAA GCC CTT 
Phe Glu Ala Leu 
250 



1733 



TCC 
Ser 



CGA TTG 
Arg Leu 



AAG CCT 
Lys Pro 
255 



GTT CAT TCT GGC 
Val His Ser Gly 



GGG GTG CAG 
Gly Val Gin 
260 



ACT GCG GGC AAC 
Thr Ala Gly Asn 
265 



1781 



AGC TGT GCC GTA GTG GAC GGC GCC GCG GCG GCT TTG 
Ser Cys Ala Val Val Asp Gly Ala Ala Ala Ala Leu 



GTG GCT CGA GAG 
Val Ala Arg Glu 



1829 




GCG ACA CAG CCG GTC TTG GCT AGG ATA CTG GCT ACC TCC GTA 1877 

Ala Thr Gin Pro Val Leu Ala Arg He Leu Ala Thr Ser Val 
285 290 295 

ATC GAG CCC GAG CAT ATG GGG CTC GGC CCT GCG CCC GCG ATT 1925 

He Glu Pro Glu His Met Gly Leu Gly Pro Ala Pro Ala lie 
305 310 



CGC CTG CTG CTT GCG CGT AGT GAT CTT AGT TTG AGG GAT ATC GAC CTC 
Arg Leu Leu Leu Ala Arg Ser Asp Leu Ser Leu Arg Asp lie Asp Leu 
315 320 325 330 



1973 



TTT GAG ATA AAC GAG GCG CAG GCC GCC CAA GTT CTA GCG GTA CAG CAT 
Phe Glu He Asn Glu Ala Gin Ala Ala Gin Val Leu Ala Val Gin His 
335 340 345 



2021 



GAA TTG GGT ATT GAG CAC TCA AAA CTT AAT ATT TGG GGC GGG GCC ATT 
Glu Leu Gly He Glu His Ser Lys Leu Asn He Trp Gly Gly Ala He 
350 355 360 



2069 



GCA 
Ala 




GGA CAC CCG CTT GCC GCG ACC GGA TTG CGT CTC TGC ATG ACC 2117 
Gly His Pro Leu Ala Ala Thr Gly Leu Arg Leu Cys Met Thr 
365 370 375 

CAC CAA TTG CAA GCT AAT AAC TTT CGA TAT GGA ATT GCC TCG 2165 
His Gin Leu Gin Ala Asn Asn Phe Arg Tyr Gly He Ala Ser 
385 390 



i GCA TGC ATT GGT GGG GGA CAG GGG ATG GCG GTT CTT TTA GAG AAT CCC 
Ala Cys He Gly Gly Gly Gin Gly Met Ala Val Leu Leu Glu Asn Pro 
395 400 405 410 



2213 



CAC TTC GGT TCG TCC TCT GCA CGA AGT TCG ATG ATT AAC AGA GTT GAC 
His Phe Gly Ser Ser Ser Ala Arg Ser Ser Met He Asn Arg Val Asp 
415 420 425 



2261 



CAC 
His 



TAT 
Tyr 



CCA CTG 
Pro Leu 
4 30- 



AGC 
Ser 

'4 31 



TAA CGGGCATCTC CTTTGTTGCT TTGAGGTGGC 



2309 



HR 199 



-82- 

GCACGAAGGA GGGCTCGAAA ATCTCTGCTA AAAACAAGAA GAAGGAACAG GGAACATGAT 2369 

TAGTTTCGCT CGTATGGCAG AAAGTTTAGG AGTCCAGGCT AAACTTGCCC TTGCCTTCGC 24 29 

ACTCGTATTA TGTGTCGGGC TGATTGTTAC CGGCACGGGT TTCTACAGTG TACATACCTT 24 8 9 

GTCAGGGTTG GTGGGAATTC 2509 
FIG. 2q: 



HR 199 



-83- 



GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC 60 

GTGACGAGGC CACACT GTG AGT TGG TCA GGG GGG GOT TAG TOG GCG TTT TCC 112 
Met Ser Trp Ser Gly Gly Ala Tyr Ser Ala Phe Ser 
15 10 



GAG ACT GCG TTG GTT GCG GCA GTG CGC ACC CCC TGG ATT GAT TGC GGG 
Asp Thr Ala Leu Val Ala Ala Val Arg Thr Pro Trp lie Asp Cys Gly 
15 20 25 



160 



GGT GCG CTG TCG CTG GTG TCG CCT ATC GAC TTA GGG GTA AAG GTC GCT 
Gly Ala Leu Ser Leu Val Ser Pro lie Asp Leu Gly Val Lys Val Ala 
30 35 40 



208 



304 



352 




Ufjf. uju\ m-i" dvrrj k>UT 'u'uiu T^tu l ui r Oinmu kjUifk Ui'yk iviu utu u^vv 

Arg Glu Val Leu Met Arg Ala Ser Leu Glu Pro Gin Met Val Asp Ser 

45 50 55 60 

GTA CTC GCA GGG TCT ATG GCT CAA GCA AGC TTT GAT GCT TAC CTG GTC 

Val Leu Ala Gly Ser Met Ala Gin Ala Ser Phe Asp Ala Tyr Leu Leu 

65 70 75 

CCG CGG CAC ATT GGC TTG TAC AGC GGT GTT CCC AAG TCG GTT CCG GCC 

Pro Arg His lie Gly Leu Tyr Ser Gly Val Pro Lys Ser Val Pro Ala 

80 85 90 



TTG GGG GTG CAG CGC ATT TGC GGC ACA GGC TTC GAA CTG CTT CGG CAG 
Leu Gly Val Gin Arg He Cys Gly Thr Gly Phe Glu Leu Leu Arg Gin 
95 100 105 



400 



GCC GGC GAG CAG ATT TCC CAA GGC GCT GAT CAC GTG CTG TGT GTC GCG 
Ala Gly Glu Gin He Ser Gin Gly Ala Asp His Val Leu Cys Val Ala 
110 115 120 



448 




GCA GAG TCC ATG TCG CGT AAC CCC ATC GCG TCG TAT ACA CAC CGG GGC 
Ala Glu Ser Met Ser Arg Asn Pro He Ala Ser Tyr Thr His Arg Gly 
125 130 135 140 



GG TTC CGC CTC GGT GCG CCC GTT GAG TTC AAG GAT TTT TTG TGG GAG 
ly Phe Arg Leu Gly Ala Pro Val Glu Phe Lys Asp Phe Leu Trp Glu 
145 150 155 



496 



544 



GCA TTG TTT GAT CCT GCT CCA GGA CTC GAC ATG ATC GCT ACC GCA GAA 
Ala Leu Phe Asp Pro Ala Pro Gly Leu Asp Met lie Ala Thr Ala Glu 
160 165 170 



592 



AAC CTG GCG CGC A TTG AGG GCG CAA GAG GAG AAA TGG ATT GAC CAA GAG 
Asn Leu Ala Arg Leu Arg Ala Gin Glu Glu Lys Trp He Asp Gin Glu 
175 176 197 200 205 



641 



ATC GTG GCT GTT ACG GAT GAA CAG TTC GAT TTA GAG GGC TAC AAC AGT 
He Val Ala Val Thr Asp Glu Gin Phe Asp Leu Glu Gly Tyr Asn Ser 
210 215 220 



689 



CGA GCA ATT GAA-CTG-GGT CGG AAG GCA AAA TTG TTG ATC GTG ACA GTC 
Arg Ala He Glu Leu Pro Arg Lys Ala Lys Leu Leu He Val Thr Val 
225 230 235 240 



737 



HR 199 



-84- 



ATC CGC GGC CTA GCA GTC TTT GAA GCC CTT TCC CGA TTG AAG CCT GTT 
lie Arg Gly Leu Ala Val Phe Glu Ala Leu Ser Arg Leu Lys Pro Val 
245 250 255 



785 



CAT TCT GGC GGG GTG CAG ACT GCG GGC AAC AGC TGT GCC GTA GTG GAC 833 
His Ser Gly Gly Val Gin Thr Ala Gly Asn Ser Cys Ala Val Val Asp 
260 265 270 



GGC GCC GCG GCG GCT TTG GTG GCT CGA GAG TCG TCT GCG ACA CAG CCG 881 

Gly Ala Ala Ala Ala Leu Val Ala Arg Glu Ser Ser Ala Thr Gin Pro 
275 280 285 

GTC TTG GCT AGG ATA CTG GCT ACC TCC GTA GTC GGG ATC GAG CCC GAG 929 

Val Leu Ala Arg He Leu Ala Thr Ser Val Val Gly He Glu Pro Glu 

290 295 300 

CAT ATG GGG CTC GGC CCT GCG CCC GCG ATT CGC CTG CTG CTT GCG CGT 977 

His Met Gly Leu Gly Pro Ala Pro Ala He Arg Leu Leu Leu Ala Arg 

305 310 315 320 



AGT GAT CTT AGT TTG AGG GAT ATC GAC CTC TTT GAG ATA AAC GAG GCG 1025 
Ser Asp Leu Ser Leu Arg Asp He Asp Leu Phe Glu He Asn Glu Ala 
325 330 335 

CAG GCC GCC CAA GTT CTA GCG GTA CAG CAT GAA TTG GGT ATT GAG CAC 107 3 

Gin Ala Ala Gin Val Leu Ala Val Gin His Glu Leu Gly He Glu His 
340 345 350 

TCA AAA CTT AAT ATT TGG GGC GGG GCC ATT GCA CTT GGA CAC CCG CTT 1121 
Ser Lys Leu Asn He Trp Gly Gly Ala He Ala Leu Gly His Pro Leu 
355 360 365 

GCC GCG ACC GGA TTG CGT CTC TGC ATG ACC CTC GCT CAC CAA TTG CAA 1169 
Ala Ala Thr Gly Leu Arg Leu Cys Met Thr Leu Ala His Gin Leu Gin 
370 375 380 



GCT AAT AAC TTT CGA TAT GGA ATT GCC TCG GCA TGC ATT GGT GGG GGA 1217 
Ala Asn Asn Phe Arg Tyr Gly He Ala Ser Ala Cys He Gly Gly Gly 
385 390 395 400 

-AG GGG ATG GCG GTT CTT TTA GAG AAT CCC CAC TTC GGT TCG TCC TCT 12 65 

Gin Gly Met Ala Val Leu Leu Glu Asn Pro His Phe Gly Ser Ser Ser 
405 410 415 



GCA CGA AGT TCG ATG ATT AAC AGA GTT GAC CAC TAT CCA CTG AGC TAA 1313 
Ala Arg Ser Ser Met He Asn Arg Val Asp His Tyr Pro Leu Ser 
420 425 430 431 

CGGGCATCTC CTTTGTTGCT TTGAGGTGGC GCACGAAGGA GGGCTCGAAA ATCTCTGCTA 137 3 

AAAACAAGAA GAAGGAACAG GGAACATGAT TAGTTTCGCT CGTATGGCAG AAAGTTTAGG 14 33 

AGTCCAGGCT AAACTTGCCC TTGCCTTCGC ACTCGTATTA TGTGTCGGGC TGATTGTTAC 14 93 

CGGCACGGGT TTCTACAGTG TACATACCTT GTCAGGGTTG GTGGGAATTC 154 3 



FIG. 2r: 



HR 199 



-85- 



Sequenz 1 

CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 

GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 

GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 180 

CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 24 0 

AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 

GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA 360 

TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 20 

AAAGAGCATG CAACTGACCA ACAAGAAAAT CGTCGTCACC GGAGTGTCCT CCGGTATCGG 4 80 

TGCCGAAACT GCCCGCGTTC TGCGCTCTCA CGGCGCCACA GTGATTGGCG TAGATCGCAA 54 0 

CATGCCGAGC CTGACTCTGG ATGCTTTCGT TCAGGCTGAC CTGAGCCATC CTGAAGGCAT 600 

CGATAAGGCC ATCGGGACAG CAAGCGAACC GGAATTGCCA GCTGGGGCGC CCTCTGGTAA 660 

GGTTGGGAAG CCCTGCAAAG TAAACTGGAT GGCTTTCTTG CCGCCAAGGA TCTGATGGCG 720 

.-^...^ nAfimnATPA AnPiTrT£A^-AAGAi;;A £ ;;A£& ATnPiGnATCr^TXTCGa^^PL^TOf^A L MQ, 

TGGATTGCAC GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG CTATTCGGCT ATGACTGGGC 84 0 

ACAACAGACA ATCGGCTGCT CTGATGCCGC CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC 900 

GGTTCTTTTT GTCAAGACCG ACCTGTCCGG TGCCCTGAAT GAACTGCAGG ACGAGGCAGC 960 

^IH^^ GCGGCTATCG TGGCTGGCCA CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC 1020 

^^^^^ TGAAGCGGGA AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC TCCTGTCATC 1080 

^^^^P TCACCTTGCT CCTGCCGAGA AAGTATCCAT CATGGCTGAT GCAATGCGGC GGCTGCATAC 114 0 

^^^^ GCTTGATCCG GCTACCTGCC CATTCGACCA CCAAGCGAAA CATCGCATCG AGCGAGCACG 1200 

TACTCGGATG GAAGCCGGTC TTGTCGATCA GGATGATCTG GACGAAGAGC ATCAGGGGCT 12 60 

CGCGCCAGCC GAACTGTTCG CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT 1320 

CGTGACCCAT GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC GCTTTTCTGG 1380 

ATTCATCGAC TGTGGCCGGC TGGGTGTGGC GGACCGCTAT CAGGACATAG CGTTGGCTAC 14 40 

CCGTGATATT GCTGAAGAGC TTGGCGGCGA ATGGGCTGAC CGCTTCCTCG TGCTTTACGG 1500 

TATCGCCGCT CCCGATTCGC AGCGCATCGC CTTCTATCGC CTTCTTGACG AGTTCTTCTG 1560 

AGCGGGACTC TGGGGTTCGA AATGACCGAC CAAGCGACGC CCTGGCCGCG GTGATTGCAT 1620 

TCATGTGTGC TGAGGAGTCA CGTTGGATCA ACGGCATAAA TATTCCAGTG GACGGAGGTT 168 0 

TGGCATCGAC CTACGTGTAA GTTCGTGGAC GCCCTTTGCA CGCGCACTAT ATCTCTATGC 174 0 

AGCAGCTGAA AGCAGCTTTG GTTTTGATCG GAGGTAGCGG GCGGAAAGGT GCAGAATGTC 1800 

TAAATAATAA AGGATTCTTG TGAAGCTTTA GTTGTCCGTA AACGAAAATA AAAATAAAGA 18 60 

GGAATGATAT GAAAGCAAGT AGATCAGTCT GCACTTTCAA AATAGCTACC CTGGCAGGCG 1920 

CCATTTATGC AGCGCTGCCA ATGTCAGCTG CAAACTCGAT GCAGCTGGAT GTAGGTAGCT 198 0 

CGGATTGGAC GGTGCGTTGG GGACAACACC CTCAAGTATA GCCTTGCCTC TCGCCTGAAT 204 0 

GAGCAAGACT CAAGTCTGAC AAATGCGCCG ACTGTCAATG GTTATATCCG GATATTCAAA 2100 

j^^^^^ GTCAGGGTGA TCGTAACTTT GACCGGGGGC TTGGTATCCA ATCGTCTCGA TATTCTGGCT 2160 

V^^^^^GCAG 2164 



H'R 199 



-86- 



Sequenz 2 



CTGCAGCCAG 
GGCTCCAATT 
GCTAGGGAGA 
CATTCTGCAT 
AAGGTTGCTA 
GCATGGAAAT 
TGGAAGCACG 
AAAGAGCATG 
TGCCGAAACT 
CATGCCGAGC 
AGGCGGTTTG 
GACATGGAAG 



GGCTGAAAAG 
GCTCGATGGC 
TAAATTTGCT 
CATGAAATTC 
GGAGAGTGCA 
GGCATGAGCT 
ATTCCTCGCC 
CAACTGACCA 
GCCCGCGTTC 
CTGACTCTGG 
CGTATTGGGC 
CCATCACTUy^ 



GAGGGATTCA 
GCCGCGATTG 
GGCCATGGTG 
ATGAAATCAT 
TTGCTCGTAA 
TTGCTGGATA 
CGGTAGAGCG 
ACAAGAAAAT 
TGCGCTCTCA 
ATGCTTTCGT 
GCATGCATAA 
CGGCATGATG 



GTGAGGTCAT 
AGTGTCTTGG 
GCGGCCCCTG 
CACTTTTCGG 
GCCCAGGAAG 
TGATTAGAGA 
GTAACCGCGA 
CGTCGTCACC 
CGGCGCCACA 
TCAGGCTGAC 
AAACTGTTGT 
AACCTGAATC 



TCCCCATGGA CGCACACCGT- 



GAAGGGAGGG 
GCGCGGTCTT 
ATGGGTTGGA 
GGGGTGGGTG 
CACGCGGGTT 
CATTAACTAT 
CATTCAGGAC 
GGAGTGTCCT 
GTGATTGGCG 
CTGAGCCATC 
AATTCATTAA 
GCCAGCGGCA 
GGAAACGGAT 



GACGGCGCCT 
GGAGAGTTCG 
TGATTTTCTG 
CACGGGATTG 
TCAGGATGGT 
TTTGGCGGAA 
CGTAAAAAGG 
CCGGTATCGG 
TAGATCGCAA 
CTGAGGGGAG 
GCATTCTGCC 
TCAGCACCTT 
GAAGGCACGA^ 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 





ACCCAGTTGA 
CGCAACTGGT 
ATGGCTTGTT 
CGTTACGCCG 
CGATGTTACG 
CATTCGCACA 
TTTCGGTCGT 
CCTCGGGAAC 
GGTTGTTGGC 
CTATATCTAT 
CATCAATCTC 
AGATTACGGT 
GATGCACTTT 
CTTCCCTGAT 
CAGTGGACGG 
ACTATATCTC 
AAGGTGCAGA 
AAATAAAAAT 
CTACCCTGGC 
TGGATGTAGG 
GCCTCTCGCC 
ATCCGGATAT 
CTCGATATTC 



CATAAGCCTG 
CCAGAACCTT 
ATGACTGTTT 
TGGGTCGATG 
CAGCAGGGCA 
TGTAGGCTCG 
GAGTTCGGAG 
TTGCTCCGTA 
GCTCTCGCGG 
GATCTCGCAG 
CTCAAGCATG 
GACGATCCCG 
GATATCGACC 
TGCATTCATG 
AGGTTTGGCA 
TATGCAGCAG 
ATGTCTAAAT 
AAAGAGGAAT 
AGGCGCCATT 
TAGCTCGGAT 
TGAATGAGCA 
TCAAAGTCAG 
TGGCTGCAG 



TTCGGTTCGT 
GACCGAACGC 
TTTTGTACAG 
TTTGATGTTA 
GTCGCCCTAA 
GCCCTGACCA 
ACGTAGCCAC 
GTAAGACATT 
CTTACGTTCT 
TCTCCGGCGA 
AGGCCAACGC 
CAGTGGCTCT 
CAAGTACCGC 
TGTGCTGAGG 
TCGACCTACG 
CTGAAAGCAG 
AATAAAGGAT 
GATATGAAAG 
TATGCAGCGC 
TGGACGGTGC 
AGACTCAAGT 
GGTGATCGTA 



AAACTGTAAT 
AGCGGTGGTA 
TCTATGCCTC 
TGGAGCAGCA 
AACAAAGTTA 
AGTCAAATCC 
CTACTCCCAA 
CATCGCGCTT 
GCCCAGGTTT 
GCACCGGAGG 
GCTTGGTGCT 
CTATACAAAG 
CACCTAACAA 
AGTCACGTTG 
TGTAAGTTCG 
CTTTGGTTTT 
TCTTGTGAAG 
CAAGTAGATC 
TGCCAATGTC 
GTTGGGGACA 
CTGACAAATG 
ACTTTGACCG 



GCAAGTAGCG 
ACGGCGCAGT 
GGGCATCCAA 
ACGATGTTAC 
GGTGGCTCAA 
ATGCGGGCTG 
CATCAGCCGG 
GCTGCCTTCG 
GAGCAGCCGC 
CAGGGCATTG 
TATGTGATCT 
TTGGGCATAC 
TTCGTTCAAG 
GATCAACGGC 
TGGACGCCCT 
GATCGGAGGT 
CTTTAGTTGT 
AGTCTGCACT 
AGCTGCAAAC 
ACACCCTCAA 
CGCCGACTGT 
GGGGCTTGGT 



TATGCGCTCA 
GGCGGTTTTC 
GCAGCAAGCG 
GCAGCAGCAA 
GTATGGGCAT 
CTCTTGATCT 
ACTCCGATTA 
ACCAAGAAGC 
GTAGTGAGAT 
CCACCGCGCT 
ACGTGCAAGC 
GGGAAGAAGT 
CCGAGATCGG 
ATAAATATTC 
TTGCACGCGC 
AGCGGGCGGA 
CCGTAAACGA 
TTCAAAATAG 
TCGATGCAGC 
GTATAGCCTT 
CAATGGTTAT 
ATCCAATCGT 



840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
■I860 
1920 
1980 
2040 
2100 
2119 
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Sequenz 3 

CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT 60 

GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG 120 

GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG 18 0 

CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG 24 0 

AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT 300 

GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA 360 

TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG 4 20 

AAAGAGCATG CAACTGACCA ACAAGAAAAT CGTCGTCACC GGAGTGTCCT CCGGTATCGG 48 0 

TGCCGAAACT GCCCGCGTTC TGCGCTCTCA CGGCGCCACA GTGATTGGCG TAGATCGCAA 54 0 

CATGCCGAGC CTGACTCTGG ATGCTTTCGT TCAGGCTGAC CTGAGCCATC CTGAAGGCAT 600 

CGATCAACGG CATAAATATT CCAGTGGACG GAGGTTTGGC ATCGACCTAC GTGTAAGTTC 660 

GTGGACGCCC TTTGCACGCG CACTATATCT CTATGCAGCA GCTGAAAGCA GCTTTGGTTT 720 



GCTTTAGTTG TCCGTAAACG AAAATAAAAA TAAAGAGGAA TGATATGAAA GCAAGTAGAT 84 0 

CAGTCTGCAC TTTCAAAATA GCTACCCTGG CAGGCGCCAT TTATGCAGCG CTGCCAATGT 900 

CAGCTGCAAA CTCGATGCAG CTGGATGTAG GTAGCTCGGA TTGGACGGTG CGTTGGGGAC 960 

AACACCCTCA AGTATAGCCT TGCCTCTCGC CTGAATGAGC AAGACTCAAG TCTGACAAAT 1020 

GCGCCGACTG TCAATGGTTA TATCCGGATA TTCAAAGTCA GGGTGATCGT AACTTTGACC 1080 

GGGGGCTTGG TATCCAATCG TCTCGATATT CTGGCTGCAG 1120 
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Sequenz 4 

GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 

GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 

TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 

TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 24 0 

GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300 

CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA 3 60 

CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 4 20 

AGAATAACAA TTGACTCCTC AGGAGGTCAG CGATGAGCAT TCTTGGTTTG AATGGTGCCC 4 80 

CGGTCGGAGC TGAGCAGCTG GGCTCGGCTC TTGATCGCAT GAAGAAGGCG CACCTGGAGC 54 0 

AGGGGCCTGC AAACTTGGAG CTGCGTCTGA GTAGGCTGGA TCGTGCGATT GCAATGCTTC 600 

TGGAAAATCG TGAAGCAATT GCCGACGCGG TTTCTGCTGA CTTTGGCAAT CGCAGCCGTG 660 

AGCAAACACT GCTTTGCGAC ATTGCTGGCT CGGTGGCAAG CCTGAAGGAT AGCCGCGAGC 720 

nnn^nn.nnisT. r.^nr:T^rpr^r.j,r. rrnr.T^T^nnrrr AnAAr^nrnAT r.TTTrr Anr.r. ncn q A nC QhC 7fln 

GCGTTGAGTT TCAGCCGCTG GGTGTCGTTG GGGTCATTAG TCCCTGGAAC TTCCCTATCG 840 

TACTGGCCTT TGGGCCGCTG GCCGGCATAT TCGCAGCAGG TAATCGCGCC ATGCTCAAGC 900 

g^^^ CGTCCGAGCT TACCCCGCGG ACTTCTGCCC TGCTTGCGGA GCTAATTGCT CGTTACTTCG 960 

^Bj^^ ATGAAACTGA GCTGACTACA GTGCTGGGCG ACGCTGAAGT CGGTGCGCTG TTCAGTGCTC 1020 

^^^^^ AGCCTTTCGA TCATCTGATC TTCACCGGCG GCACTGCCGT GGCCAAGCAC ATCATGCGTG 108 0 

^^^^ CCGCGGCGGA TAACCTAGTG CCCGTTACCC TGGAATTGGG TGGCAAATCG CCGGTGATCG 114 0 

TTTCCCGCAG TGCAGATATG GCGGACGTTG CACAACGGGT GTTGACGGTG AAAACCTTCA 1200 

ATGCCGGGCA AATCTGTCTG GCACCGGACT ATGTGCTGCT GCCGGAAGGG ACAGCAAGCG 1260 

AACCGGAATT GCCAGCTGGG GCGCCCTCTG GTAAGGTTGG GAAGCCCTGC AAAGTAAACT 1320 

GGATGGCTTT CTTGCCGCCA AGGATCTGAT GGCGCAGGGG ATCAAGATCT GATCAAGAGA 138 0 

CAGGATGAGG ATCGTTTCGC ATGATTGAAC AAGATGGATT GCACGCAGGT TCTCCGGCCG 14 4 0 

CTTGGGTGGA GAGGCTATTC GGCTATGACT GGGCACAACA GACAATCGGC TGCTCTGATG 1500 

CCGCCGTGTT CCGGCTGTCA GCGCAGGGGC GCCCGGTTCT TTTTGTCAAG ACCGACCTGT 1560 

CCGGTGCCCT GAATGAACTG CAGGACGAGG CAGCGCGGCT ATCGTGGCTG GCCACGACGG 1620 

GCGTTCCTTG CGCAGCTGTG CTCGACGTTG TCACTGAAGC GGGAAGGGAC TGGCTGCTAT 1680 

TGGGCGAAGT GCCGGGGCAG GATCTCCTGT CATCTCACCT TGCTCCTGCC GAGAAAGTAT 17 4 0 

CCATCATGGC TGATGCAATG CGGCGGCTGC ATACGCTTGA TCCGGCTACC TGCCCATTCG 1800 

ACCACCAAGC GAAACATCGC ATCGAGCGAG CACGTACTCG GATGGAAGCC GGTCTTGTCG 18 60 

ATCAGGATGA TCTGGACGAA GAGCATCAGG GGCTCGCGCC AGCCGAACTG TTCGCCAGGC 1920 

TCAAGGCGCG CATGCCCGAC GGCGAGGATC TCGTCGTGAC CCATGGCGAT GCCTGCTTGC 1980 

CGAATATCAT GGTGGAAAAT GGCCGCTTTT CTGGATTCAT CGACTGTGGC CGGCTGGGTG 204 0 

TGGCGGACCG CTATCAGGAC ATAGCGTTGG CTACCCGTGA TATTGCTGAA GAGCTTGGCG 2100 

^1^^^^ GCGAATGGGC TGACCGCTTC CTCGTGCTTT ACGGTATCGC CGCTCCCGAT TCGCAGCGCA 2160 
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TCGCCTTCTA TCGCCTTCTT GACGAGTTCT 
CGACCAAGCG ACGCCCGCCA TGCCAAGCCT 
AACTTGGCGA TGCGCGCACC CTACGGAGAA 
TCAACGGAGT GTTAGAACCG TTGGTAGTGG 
GGGCCCGTTT CTTGAGTATT CATTGGATAG 
TGATGAGCAC CCTGGAAGGC GCGCTGTACG 
GACGGAACTC CGTTCCCCAG TACCGCGATG 
ACGCCGCCTG ACGCTAAGCG GGGGCGGGGG 
TGAGTAGGCT CTTGGATGCC GCGGCGGCTG 
CGATGGATTC GATTGCCCGT GCTGCCGGCG 
CGAGCAAGGA AGAACTCATT TCCCGGTTAG 
TC 



TCTGAGCGGG 


ACTCTGGGGT 


TCGAAATGAC 


2220 


GTTCTCGTGC 


AAAGTCCTGT 


GGGTGAGTCG 


2280 


GCGATCCACG 


GACTGCTCTC 


TGTCCTCCTT 


2340 


TTTTGGACGG 


GCCCAGGAGC 


ATGCGCTTCT 


2400 


TCACGCGTGG 


TAGCTTCGAG 


CCTGCACAGC 


2460 


CGGACGACTG 


GGTTCATCTT 


CGCCATTCAT 


2520 


ACTATTTTGC 


CTCTTCCGAT 


GTCCGATTCC 


2580 


CGCCCGCATC 


CCAGCCCAGA 


CAGCAACAAA 


2640 


AGATTGGTAA 


CGGCAATTTC 


GTCAATGTGA 


2700 


TCTCAAAAAA 


AACGCTGTAC 


GTCTTGGTGG 


2760 


TGGCTCGAGA 


CATGTCCAAC 


CTTGAGGAAT 


2820 








2822 
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Sequenz 5 

GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 

GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 

TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 

TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 24 0 

GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300 

CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360 

CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 4 20 

AGAATAACAA TTGACTCCTC AGGAGGTCAG CGATGAGCAT TCTTGGTTTG AATGGTGCCC 4 80 

CGGTCGGAGC TGAGCAGCTG GGCTCGGCTC TTGATCGCAT GAAGAAGGCG CACCTGGAGC 540 

AGGGGCCTGC AAACTTGGAG CTGCGTCTGA GTAGGCTGGA TCGTGCGATT GCAATGCTTC 600 

TGGAAAATCG TGAAGCAATT GCCGACGCGG TTTCTGCTGA CTTTGGCAAT CGCAGCCGTG 660 

AGCAAACACT GCTTTGCGAC ATTGCTGGCT CGGTGGCAAG CCTGAAGGAT AGCCGCGAGC 720 

firr;Tr.r.rrftA ATr,p,aTr.r,ar, rrrr.AAr.Arr. AC.AAr.nrr.JXT nrrTr.rj\r.nn ccr.nAC.C.CAn i^n 

GCGTTGAGTT TCAGCCGCTG GGTGTCGTTG GGGTCATTAG TCCCTGGAAC TTCCCTATCG 84 0 

TACTGGCCTT TGGGCCGCTG GCCGGCATAT TCGCAGCAGG TAATCGCGCC ATGCTCAAGC 900 

CGTCCGAGCT TACCCCGCGG ACTTCTGCCC TGCTTGCGGA GCTAATTGCT CGTTACTTCG 960 

ATGAAACTGA GCTGACTACA GTGCTGGGCG ACGCTGAAGT CGGTGCGCTG TTCAGTGCTC 1020 

AGCCTTTCGA TCATCTGATC TTCACCGGCG GCACTGCCGT GGCCAAGCAC ATCATGCGTG 1080 

CCGCGGCGGA TAACCTAGTG CCCGTTACCC TGGAATTGGG TGGCAAATCG CCGGTGATCG 114 0 

TTTCCCGCAG TGCAGATATG GCGGACGTTG CACAACGGGT GTTGACGGTG AAAACCTTCA 1200 

ATGCCGGGCA AATCTGTCTG GCACCGGACT ATGTGCTGGG GGAGAGGCGG TTTGCGTATT 12 60 

GGGCGCATGC ATAAAAACTG TTGTAATTCA TTAAGCATTC TGCCGACATG GAAGCCATCA 132 0 

CAAACGGCAT GATGAACCTG AATCGCCAGC GGCATCAGCA CCTTGTCGCC TTGCGTATAA 1380 

TATTTGCCCA TGGACGCACA CCGTGGAAAC GGATGAAGGC ACGAACCCAG TTGACATAAG 14 4 0 

CCTGTTCGGT TCGTAAACTG TAATGCAAGT AGCGTATGCG CTCACGCAAC TGGTCCAGAA 1500 

CCTTGACCGA ACGCAGCGGT GGTAACGGCG CAGTGGCGGT TTTCATGGCT TGTTATGACT 15 60 

GTTTTTTTGT ACAGTCTATG CCTCGGGCAT CCAAGCAGCA AGCGCGTTAC GCCGTGGGTC 1620 

GATGTTTGAT GTTATGGAGC AGCAACGATG TTACGCAGCA GCAACGATGT TACGCAGCAG 1680 

GGCAGTCGCC CTAAAACAAA GTTAGGTGGC TCAAGTATGG GCATCATTCG CACATGTAGG 17 4 0 

CTCGGCCCTG ACCAAGTCAA ATCCATGCGG GCTGCTCTTG ATCTTTTCGG TCGTGAGTTC 18 00 

GGAGACGTAG CCACCTACTC CCAACATCAG CCGGACTCCG ATTACCTCGG GAACTTGCTC 18 60 

CGTAGTAAGA CATTCATCGC GCTTGCTGCC TTCGACCAAG AAGCGGTTGT TGGCGCTCTC 1920 

GCGGCTTACG TTCTGCCCAG GTTTGAGCAG CCGCGTAGTG AGATCTATAT CTATGATCTC 1980 

GCAGTCTCCG GCGAGCACCG GAGGCAGGGC ATTGCCACCG CGCTCATCAA TCTCCTCAAG 2040 

CATGAGGCCA ACGCGCTTGG TGCTTATGTG ATCTACGTGC AAGCAGATTA CGGTGACGAT 2100 

CCCGCAGTGG CTCTCTATAC AAAGTTGGGC ATACGGGAAG AAGTGATGCA CTTTGATATC 2160 



HR 199 



-91 - 



GACCCAAGTA CCGCCACCTA ACAATTCGTT 
TGTGGGTGAG TCGAACTTGG CGATGCGCGC 
CTCTGTCCTC CTTTCAACGG AGTGTTAGAA 
AGCATGCGCT TCTGGGCCCG TTTCTTGAGT 
GAGCCTGCAC AGCTGATGAG CACCCTGGAA 
CTTCGCCATT CATGACGGAA CTCCGTTCCC 
GATGTCCGAT TCCACGCCGC CTGACGCTAA 
AGACAGCAAC AAATGAGTAG GCTCTTGGAT 
TTCGTCAATG TGACGATGGA TTCGATTGCC 
TACGTCTTGG TGGCGAGCAA GGAAGAACTC 
AACCTTGAGG AATTC 



CAAGCCGAGA 






2220 


ACCCTACGGA 


GAAGCGATCC 


ACGGACTGCT 


2280 


CCGTTGGTAG 


TGGTTTTGGA 


CGGGCCCAGG 


2340 


ATTCATTGGA 


TAGTCACGCG 


TGGTAGCTTC 


2400 


GGCGCGCTGT 


ACGCGGACGA 


CTGGGTTCAT 


2460 


CAGTACCGCG 


ATGACTATTT 


TGCCTCTTCC 


2520 


GCGGGGGCGG 


GGGCGCCCGC 


ATCCCAGCCC 


2580 


GCCGCGGCGG 


CTGAGATTGG 


TAACGGCAAT 


2640 


CGTGCTGCCG 


GCGTCTCAAA 


AAAAACGCTG 


2700 


ATTTCCCGGT 


TAGTGGCTCG 


AGACATGTCC 


2760 








2775 
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Sequenz 6 

GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC 60 

GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG 120 

TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC 180 

TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG 24 0 

GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC 300 

CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA 360 

CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC 420 

AGAATAACAA TTGACTCCTC AGGAGGTCAG CGATGAGCAT TCTTGGTTTG AATGGTGCCC 480 

CGGTCGGAGC TGAGCAGCTG GGCTCGGCTC TTGATCGCAT GAAGAAGGCG CACCTGGAGC 54 0 

AGGGGCCTGC AAACTTGGAG CTGCGTCTGA GTAGGCTGGA TCGTGCGATT GCAATGCTTC 600 

TGGAAAATCG TGAAGCAATT GCCGACGCGG TTTCTGCTGA CTTTGGCAAT CGCAGCCGTG 660 

AGCAAACACT GCTTTGCGAC ATTGCTGGCT CGGTGGCAAG CCTGAAGGAT AGCCGCGAGC 720 

■ APfTiTnnirrrfiA ftTmnTrsi^/^ns rrrrGaaraTn j\rj\T\QrnmhT fi^TTTggftisfir;; nnvr i ncGCAC ^ttv 

GCGTTGAGTT TCAGCCGCTG GGTGTCGTTG GGGTCATTAG TCCCTGGAAC TTCCCTATCG 84 0 

TACTGGCCTT TGGGCCGCTG GCCGGCATAT TCGCAGCAGG TAATCGCGCC ATGCTCAAGC 900 

CGTCCGAGCT TACCCCGCGG ACTTCTGCCC TGCTTGCGGA GCTAATTGCT CGTTACTTCG 960 

^H^^^ ATGAAACTGA GCTGACTACA GTGCTGGGCG AGGCTGAAGT CGGTGCGCTG TTCAGTGCTC 1020 

^^^^^ AGCCTTTCGA TCATCTGATC TTCACCGGCG GCACTGCCGT GGCCAAGCAC ATCATGCGTG 1080 

^^^^ CCGCGGCGGA TAACCTAGTG CCCGTTACCC TGGAATTGGG TGGCAAATCG CCGGTGATCG 114 0 

^^^^ TTTCCCGCAG TGCAGATATG GCGGACGTTG CACAACGGGT GTTGACGGTG AAAACCTTCA 1200 

ATGCCGGGCA AATCTGTCTG GCACCGTGGG TGAGTCGAAC TTGGCGATGC GCGCACCCTA 12 60 

CGGAGAAGCG ATCCACGGAC TGCTCTCTGT CCTCCTTTCA ACGGAGTGTT AGAACCGTTG 1320 

GTAGTGGTTT TGGACGGGCC CAGGAGCATG CGCTTCTGGG CCCGTTTCTT GAGTATTCAT 1380 

TGGATAGTCA CGCGTGGTAG CTTCGAGCCT GCACAGCTGA TGAGCACCCT GGAAGGCGCG 1440 

CTGTACGCGG ACGACTGGGT TCATCTTCGC CATTCATGAC GGAACTCCGT TCCCCAGTAC 1500 

CGCGATGACT ATTTTGCCTC TTCCGATGTC CGATTCCACG CCGCCTGACG CTAAGCGGGG 1560 

GCGGGGGCGC CCGCATCCCA GCCCAGACAG CAACAAATGA GTAGGCTCTT GGATGCCGCG 1620 

GCGGCTGAGA TTGGTAACGG CAATTTCGTC AATGTGACGA TGGATTCGAT TGCCCGTGCT 1680 

GCCGGCGTCT CAAAAAAAAC GCTGTACGTC TTGGTGGCGA GCAAGGAAGA ACTCATTTCC 17 40 

CGGTTAGTGG CTCGAGACAT GTCCAACCTT GAGGAATTC 177 9 
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Sequenz 7 

CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 24 0 

AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG GATGCGTTCT CTCGAGGCGC 360 

TTCTTCCCTT CCCGGGTCGA ATTCTTGAGC GTCTCGAGCA TTGGGCTAAG ACCCGTCCAG 4 20 

AACAAACCTG CGTTGCTGCC AGGGCGGCAA ATGGGGAATG GCGTCGTATC AGCTACGCGG 4 80 

AAATGTTCCA CAACGTCCGC GCCATCGCAC AGAGCTTGCT TCCTTACGGA CTATCGGCAG 54 0 

AGCGTCCGCT GCTTATCGTC TCTGGAAATG ACCTGGAACA TCTTCAGCTG GCATTTGGGG 600 

CTATGTATGC GGGCATTCCC TATTGCCCGG TGTCTCCTGC TTATTCACTG CTGTCGCAAG 660 

ATTTGGCGAA GCTGCGTCAC ATCGTAGGTC TTCTGCAACC GGGACTGGTC TTTGCTGCCG 720 

^^^pp^ ^ ^^^^ ^^ ^ ^^ ^ ^ ^ ^ ^^^^ T^Arrr ^r-AA^g. oo^ zir,r^r--^r- n.n arrnryn^r. nan 

GTAAGGTTGG GAAGCCCTGC AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGGATCTGAT sTo" 

_ GGCGCAGGGG ATCAAGATCT GATCAAGAGA CAGGATGAGG ATCGTTTCGC ATGATTGAAC 900 

H^^^ AAGATGGATT GCACGCAGGT TCTCCGGCCG CTTGGGTGGA GAGGCTATTC GGCTATGACT 960 

^^^^ GGGCACAACA GACAATCGGC TGCTCTGATG CCGCCGTGTT CCGGCTGTCA GCGCAGGGGC 1020 

GCCCGGTTCT TTTTGTCAAG ACCGACCTGT CCGGTGCCCT GAATGAACTG CAGGACGAGG 1080 

^^^^ CAGCGCGGCT ATCGTGGCTG GCCACGACGG GCGTTCCTTG CGCAGCTGTG CTCGACGTTG 114 0 

TCACTGAAGC GGGAAGGGAC TGGCTGCTAT TGGGCGAAGT GCCGGGGCAG GATCTCCTGT 1200 

CATCTCACCT TGCTCCTGCC GAGAAAGTAT CCATCATGGC TGATGCAATG CGGCGGCTGC 12 60 

ATACGCTTGA TCCGGCTACC TGCCCATTCG ACCACCAAGC GAAACATCGC ATCGAGCGAG 1320 

CACGTACTCG GATGGAAGCC GGTCTTGTCG ATCAGGATGA TCTGGACGAA GAGCATCAGG 138 0 

GGCTCGCGCC AGCCGAACTG TTCGCCAGGC TCAAGGCGCG CATGCCCGAC GGCGAGGATC 14 4 0 

TCGTCGTGAC CCATGGCGAT GCCTGCTTGC CGAATATCAT GGTGGAAAAT GGCCGCTTTT 1500 

CTGGATTCAT CGACTGTGGC CGGCTGGGTG TGGCGGACCG CTATCAGGAC ATAGCGTTGG 1560 

CTACCCGTGA TATTGCTGAA GAGCTTGGCG GCGAATGGGC TGACCGCTTC CTCGTGCTTT 1620 

ACGGTATCGC CGCTCCCGAT TCGCAGCGCA TCGCCTTCTA TCGCCTTCTT GACGAGTTCT 1680 

TCTGAGCGGG ACTCTGGGGT TCGAAATGAC CGACCAAGCG ACGCCCCTGT TTTGCAATGG 174 0 

CGGTCGGCGA AAGTTGATGC GCTGTATCGT GGTGAAGATC AATCCATGCT GCGTGACGAG 1800 

GCCACACTGT GAGTTGGTCA GGGGGGGCTT ACTCGGCGTT TTCCGACACT GCGTTGGTTG 18 60 

CGGCAGTGCG CACCCCCTGG ATTGATTGCG GGGGTGCCCT GTCGCTGGTG TCGCCTATCG 1920 

ACTTAGGGGT AAAGGTCGCT CGCGAAGTTC TGATGCGTGC GTCGCTTGAA CCACAAATGG 1980 

TCGATAGCGT ACTCGCAGGC TCTATGGCTC AAGCAAGCTT TGATGCTTAC CTGCTCCCGC 204 0 

GGCACATTGG CTTGTACAGC GGTGTTCCCA AGTCGGTTCC GGCCTTGGGG GTGCAGCGCA 2100 

I^^^^^TTTGCGGCAC AGGCTTCGAA CTGCTTCGGC AGGCCGGCGA GCAGATTTCC CAAGGCGCTG 2160 

^^^^^«.TCACGTGCT GTGTGTCGCG GGCTGCAG 2188 
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Sequenz 8 



CTGCAGCCGA 
CCCGCGGCAC 
CTCGCCTCAT 
CAAGGCCAGT 
AACCGCAGGC 
CTCCGGTTGA 
TTCTTCCCTT 
AACAAACCTG 
AAATGTTCCA 
AGCGTCCGCT 
CTATGTATGC 
ATTTGGCGAA 



GCATCGATTG 
TATCCAATCT 
TTCAATCTCT 
CGCGGAGAGT 
ATCATCATGC 
GGTTACGCAA 
CCCGGGTCGA 
CGTTGCTGCC 
CAACGTCCGC 
GCTTATCGTC 
GGGCATTCCC 
GCTGCGTCAC 



AGCACTTTAC 
AAATCGATCT 
AACTTGATAA 
CTCGAAGAGG 
TCTGCTCAGC 
GACGCTGGAG 
ATTCTTGAGC 
AGGGCGGCAA 
GCCATCGCAC 
TCTGGAAATG 
TATTGCCCGG 
ATCGTAGGTC 



..j^^QCAcrnrr Tn^rprrnr^rir.r. r.Ar.Annr.nnT TTnrr.TATTr crrr.r.ATCCA TAAj^ ARq3uya 



CCAGCTGCGC 
TCGGGCGCCG 
AAACAGAGCT 
AGAGTACAGT 
CACGCTACCG 
GTATTGTCCG 
GTCTCGAGCA 
ATGGGGAATG 
AGAGCTTGCT 
ACCTGGAACA 
TGTCTCCTGC 
TTCTGCAACC 



TGGCTGACCA 
CGGGCATCAT 
GTTCTCCGGT 
GhACGCCGAG 
CAGTGTGTCG 
GATGCGTTCT 
TTGGGCTAAG 
GCGTCGTATC 
TCCTTACGGA 
TCTTCAGCTG 
TTATTCACTG 
GGGACTGGTC 



TTCAGAATGG 
GCCCGCGGCG 
CTTGGTGGAT 
TCCACATTGC 
ATTGGTCATC 
CTCGAGGCGC 
ACCCGTCCAG 
AGCTACGCGG 
CTATCGGCAG 
GCATTTGGGG 
CTGTCGCAAG 
TTTGCTGCCG 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 





TGTAATTCAT 
ATCGCCAGCG 
CGTGGAAACG 
AATGCAAGTA 
GTAACGGCGC 
CTCGGGCATC 
GCAACGATGT 
TTAGGTGGCT 
TCCATGCGGG 
CAACATCAGC 
CTTGCTGCCT 
TTTGAGCAGC 
AGGCAGGGCA 
GCTTATGTGA 
AAGTTGGGCA 
CAATTCGTTC 
TGCGCTGTAT 
TCAGGGGGGG 
TGGATTGATT 
GCTCGCGAAG 
GGCTCTATGG 
AGCGGTGTTC 
GAACTGCTTC 
CGGGCTGCA 



TAAGCATTCT 
GCATCAGCAC 
GATGAAGGCA 
GCGTATGCGC 
AGTGGCGGTT 
CAAGCAGCAA 
TACGCAGCAG 
CAAGTATGGG 
CTGCTCTTGA 
CGGACTCCGA 
TCGACCAAGA 
CGCGTAGTGA 
TTGCCACCGC 
TCTACGTGCA 
TACGGGAAGA 
AAGCCGAGAT 
CGTGGTGAAG 
CTTACTCGGC 
GCGGGGGTGC 
TTCTGATGCG 
CTCAAGCAAG 
CCAAGTCGGT 
GGCAGGCCGG 
G 



GCCGACATGG 
CTTGTCGCCT 
CGAACCCAGT 
TCACGCAACT 
TTCATGGCTT 
GCGCGTTACG 
CAACGATGTT 
CATCATTCGC 
TCTTTTCGGT 
TTACCTCGGG 
AGCGGTTGTT 
GATCTATATC 
GCTCATCAAT 
AGCAGATTAC 
AGTGATGCAC 
CGGCTTCCCC 
ATCAATCCAT 
GTTTTCCGAC 
CCTGTCGCTG 
TGCGTCGCTT 
CTTTGATGCT 
TCCGGCCTTG 
CGAGCAGATT 



AAGCCATCAC 
TGCGTATAAT 
TGACATAAGC 
GGTCCAGAAC 
GTTATGACTG 
CCGTGGGTCG 
ACGCAGCAGG 
ACATGTAGGC 
CGTGAGTTCG 
AACTTGCTCC 
GGCGCTCTCG 
TATGATCTCG 
CTCCTCAAGC 
GGTGACGATC 
TTTGATATCG 
TGTTTTGCAA 
GCTGCGTGAC 
ACTGCGTTGG 
GTGTCGCCTA 
GAACCACAAA 
TACCTGCTCC 
GGGGTGCAGC 
TCCCAAGGCG 



AAACGGCATG 
ATTTGCCCAT 
CTGTTCGGTT 
CTTGACCGAA 
TTTTTTTGTA 
ATGTTTGATG 
GCAGTCGCCC 
TCGGCCCTGA 
GAGACGTAGC 
GTAGTAAGAC 
CGGCTTACGT 
CAGTCTCCGG 
ATGAGGCCAA 
CCGCAGTGGC 
ACCCAAGTAC 
TGGCGGTCGG 
GAGGCCACAC 
TTGCGGCAGT 
TCGACTTAGG 
TGGTCGATAG 
CGCGGCACAT 
GCATTTGGGG 
CTGATCACGT 



ATGAACCTGA 
GGACGCACAC 
CGTAAACTGT 
CGCAGCGGTG 
CAGTCTATGC 
TTATGGAGCA 
TAAAACAAAG 
CCAAGTCAAA 
CACCTACTCC 
ATTCATCGCG 
TCTGCCCAGG 
CGAGCACCGG 
CGCGCTTGGT 
TCTCTATACA 
CGCCACCTAA 
CGAAAGTTGA 
TGTGAGTTGG 
GCGCACCCCC 
GGTAAAGGTC 
CGTACTCGCA 
TGGCTTGTAC 
CACAGGCTTC 
GCTGTGTGTC 



840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2171 
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Sequenz 9 

CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG 60 

CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG 120 

CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT 180 

CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC 24 0 

AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC 300 

CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG GATGCGTTCT CTCGAGGCGC 360 

TTCTTCCCTT CCCGGGTCGA ATTCTTGAGC GTCTCGAGCA TTGGGCTAAG ACCCGTCCAG 420 

AACAAACCTG CGTTGCTGCC AGGGCGGCAA ATGGGGAATG GCGTCGTATC AGCTACGCGG 4 80 

AAATGTTCCA CAACGTCCGC GCCATCGCAC AGAGCTTGCT TCCTTACGGA CTATCGGCAG 54 0 

AGCGTCCGCT GCTTATCGTC TCTGGAAATG ACCTGGAACA TCTTCAGCTG GCATTTGGGG 600 

CTATGTATGC GGGCATTCCC TATTGCCCGG TGTCTCCTGC TTATTCACTG CTGTCGCAAG 660 

ATTTGGCGAA GCTGCGTCAC ATCGTAGGTC TTCTGCAACC GGGACTGGTC TTTGCTGCCG 720 

hrrirmrhrr tttpp AGaaC RPTfiTTTTfir hhTr^r^rm'vr mrcimhGTT r;ATr;rxiCT.fiji 

ATCGTGGTGA AGATCAATCC ATGCTGCGTG ACGAGGCCAC ACTGTGAGTT GGTCAGGGGG 840 

GGCTTACTCG GCGTTTTCCG ACACTGCGTT GGTTGCGGCA GTGCGCACCC CCTGGATTGA 900 

TTGCGGGGGT GCCCTGTCGC TGGTGTCGCC TATCGACTTA GGGGTAAAGG TCGCTCGCGA 960 

AGTTCTGATG CGTGCGTCGC TTGAACCACA AATGGTCGAT AGCGTACTCG CAGGCTCTAT 1020 

GGCTCAAGCA AGCTTTGATG CTTACCTGCT CCCGCGGCAC ATTGGCTTGT ACAGCGGTGT 1080 

TCCCAAGTCG GTTCCGGCCT TGGGGGTGCA GCGCATTTGC GGCACAGGCT TCGAACTGCT 114 0 

TCGGCAGGCC GGCGAGCAGA TTTCCCAAGG CGCTGATCAC GTGCTGTGTG TCGCGGGCTG 1200 

CAG 1203 
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Secpjenz 10 

GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 240 

GGTGCACGAT GAATAGCTAC GATGGCCGTT GGTCTACCGT TGATGTGAAG GTTGAAGAAG 300 

GTATCGCTTG GGTCACGCTG AACCGCCCGG AGAAGCGCAA CGCAATGAGC CCAACTCTCA 360 

ATCGAGAGAT GGTCGAGGTT CTGGAGGTGC TGGAGCAGGA CGCAGATGCT CGCGTGCTTG 4 20 

TTCTGACTGG TGCAGGCGAA TCCTGGACCG CGGGCATGGA CCTGAAGGAG TATTTCCGCG 480 

AGACCGATGC TGGCCCCGAA ATTCTGCAAG AGAAGATTCG TCGGGGACAG CAAGCGAACC 54 0 

GGAATTGCCA GCTGGGGCGC CCTCTGGTAA GGTTGGGAAG CCCTGCAAAG TAAACTGGAT 600 

GGCTTTCTTG CCGCCAAGGA TCTGATGGCG CAGGGGATCA AGATCTGATC AAGAGACAGG 660 

ATGAGGATCG TTTCGCATGA TTGAACAAGA TGGATTGCAC GCAGGTTCTC CGGCCGCTTG 7 20 

r,r,rc,r,7\r,Acn rTATTrnr.rT ATCArTCccr. ArAAr.AnTvcA atccgctqct ctgatgccgc 7 80. 

CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT GTCAAGACCG ACCTGTCCGG 84 0 

TGCCCTGAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG TGGCTGGCCA CGACGGGCGT 900 

TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC TGAAGCGGGA AGGGACTGGC TGCTATTGGG 960 

^B|^^ CGAAGTGCCG GGGCAGGATC TCCTGTCATC TCACCTTGCT CCTGCCGAGA AAGTATCCAT 1020 

^^^^^CATGGCTGAT GCAATGCGGC GGCTGCATAC GCTTGATCCG GCTACCTGCC CATTCGACCA 1080 

^^^W CCAAGCGAAA CATCGCATCG AGCGAGCACG TACTCGGATG GAAGCCGGTC TTGTCGATCA 114 0 

^^^^ GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC GAACTGTTCG CCAGGCTCAA 1200 

GGCGCGCATG CCCGACGGCG AGGATCTCGT CGTGACCCAT GGCGATGCCT GCTTGCCGAA 1260 

TATCATGGTG GAAAATGGCC GCTTTTCTGG ATTCATCGAC TGTGGCCGGC TGGGTGTGGC 1320 

GGACCGCTAT CAGGACATAG CGTTGGCTAC CCGTGATATT GCTGAAGAGC TTGGCGGCGA 1380 

ATGGGCTGAC CGCTTCCTCG TGCTTTACGG TATCGCCGCT CCCGATTCGC AGCGCATCGC 14 4 0 

CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGCGGGACTC TGGGGTTCGA AATGACCGAC 1500 

CAAGCGACGC CCCGAGCAGG GCATGAAGCA GTTCCTTGAC GAGAAAAGCA TCAAGCCGGG 1560 

CTTGCAGACC TACAAGCGCT GATAAATGCG CCGGGGCCCT CGCTGCGCCC CCGGCCTTCC 1620 

AATAATGACA ATAATGAGGA GTGCCCAATG TTTCACGTGC CCCTGCTTAT TGGTGGTAAG 1680 

CCTTGTTCAG CATCTGATGA GCGCACCTTC GAGCGTCGTA GCCCGCTGAC CGGAGAAGTG 17 4 0 

GTATCGCGCG TCGCTGCTGC CAGTTTGGAA GATGCGGACG CCGCAGTGGC CGCTGCACAG 1800 

GCTGCGTTTC CTGAATGGGC GGCGCTTGCT CCGAGCGAAC GCCGTGCCCG ACTGCTGCGA 1860 

GCGGCGGATC TTCTAGAGGA CCGTTCTTCC GAGTTCACCG CCGCAGCGAG TGAAACTGGC 1920 

GCAGCGGGAA ACTGGTATGG GTTTAACGTT TACCTGGCGG CGGGCATGTT GCGGGGAATT 1980 

C 1981 
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Sequenz 11 

GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 2 40 

GGTGCACGAT GAATAGCTAC GATGGCCGTT GGTCTACCGT TGATGTGAAG GTTGAAGAAG 300 

GTATCGCTTG GGTCACGCTG AACCGCCCGG AGAAGCGCAA CGCAATGAGC CCAACTCTCA 360 

ATCGAGAGAT GGTCGAGGTT CTGGAGGTGC TGGAGCAGGA CGCAGATGCT CGCGTGCTTG 4 20 

TTCTGACTGG TGCAGGCGAA TCCTGGACCG CGGGCATGGA CCTGAAGGAG TATTTCCGCG 4 80 

AGACCGATGC TGGCCCCGAA ATTCTGCAAG AGAAGATTCG TCGGGGGAGA GGCGGTTTGC 54 0 

GTATTGGGCG CATGCATAAA AACTGTTGTA ATTCATTAAG CATTCTGCCG ACATGGAAGC 600 

CATCACAAAC GGCATGATGA ACCTGAATCG CCAGCGGCAT CAGCACCTTG TCGCCTTGCG 660 

TATAATATTT GCCCATGGAC GCACACCGTG GAAACGGATG AAGGCACGAA CCCAGTTGAC 720 

■ATZiAGCCTGT _TCGGTTCGTA AACTGTAATG CAAGTA^rGT ATGrGPT rAn nr7\7xr.TC.nrr. lPiC\ 

CAGAACCTTG ACCGAACGCA GCGGTGGTAA CGGCGCAGTG GCGGTTTTCA TGGCTTGTTA 8 40 

TGACTGTTTT TTTGTACAGT CTATGCCTCG GGCATCCAAG CAGCAAGCGC GTTACGCCGT 900 

GGGTCGATGT TTGATGTTAT GGAGCAGCAA CGATGTTACG CAGCAGCAAC GATGTTACGC 960 

AGCAGGGCAG TCGCCCTAAA ACAAAGTTAG GTGGCTCAAG TATGGGCATC ATTCGCACAT 1020 

GTAGGCTCGG CCCTGACCAA GTCAAATCCA TGCGGGCTGC TCTTGATCTT TTCGGTCGTG 1080 

AGTTCGGAGA CGTAGCCACC TACTCCCAAC ATCAGCCGGA CTCCGATTAC CTCGGGAACT 1140 

TGCTCCGTAG TAAGACATTC ATCGCGCTTG CTGCCTTCGA CCAAGAAGCG GTTGTTGGCG 1200 

CTCTCGCGGC TTACGTTCTG CCCAGGTTTG AGCAGCCGCG TAGTGAGATC TATATCTATG 12 60 

ATCTCGCAGT CTCCGGCGAG CACCGGAGGC AGGGCATTGC CACCGCGCTC ATCAATCTCC 1320 

TCAAGCATGA GGCCAACGCG CTTGGTGCTT ATGTGATCTA CGTGCAAGCA GATTACGGTG 1380 

ACGATCCCGC AGTGGCTCTC TATACAAAGT TGGGCATACG GGAAGAAGTG ATGCACTTTG 14 4 0 

ATATCGACCC AAGTACCGCC ACCTAACAAT TCGTTCAAGC CGAGATCGGC TTCCCCGAGC 1500 

AGGGCATGAA GCAGTTCCTT GACGAGAAAA GCATCAAGCC GGGCTTGCAG ACCTACAAGC 1560 

GCTGATAAAT GCGCCGGGGC CCTCGCTGCG CCCCCGGCCT TCCAATAATG ACAATAATGA 1620 

GGAGTGCCCA ATGTTTCACG TGCCCCTGCT TATTGGTGGT AAGCCTTGTT CAGCATCTGA 1680 

TGAGCGCACC TTCGAGCGTC GTAGCCCGCT GACCGGAGAA GTGGTATCGC GCGTCGCTGC 174 0 

TGCCAGTTTG GAAGATGCGG ACGCCGCAGT GGCCGCTGCA CAGGCTGCGT TTCCTGAATG 1800 

GGCGGCGCTT GCTCCGAGCG AACGCCGTGC CCGACTGCTG CGAGCGGCGG ATCTTCTAGA 18 60 

GGACCGTTCT TCCGAGTTCA CCGCCGCAGC GAGTGAAACT GGCGCAGCGG GAAACTGGTA 1920 

TGGGTTTAAC GTTTACCTGG CGGCGGGCAT GTTGCGGGGA ATTC 1964 
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Sequenz 12 

GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT 60 

GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC 120 

GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT 180 

AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG 24 0 

GGTGCACGAT GAATAGCTAC GATGGCCGTT GGTCTACCGT TGATGTGAAG GTTGAAGAAG 300 

GTATCGCTTG GGTCACGCTG AACCGCCCGG AGAAGCGCAA CGCAATGAGC CCAACTCTCA 360 

ATCGAGAGAT GGTCGAGGTT CTGGAGGTGC TGGAGCAGGA CGCAGATGCT CGCGTGCTTG 4 20 

TTCTGACTGG TGCAGGCGAA TCCTGGACCG CGGGCATGGA CCTGAAGGAG TATTTCCGCG 4 80 

AGACCGATGC TGGCCCCGAA ATTCTGCAAG AGAAGATTCG TCGCGAGCAG GGCATGAAGC 54 0 

AGTTCCTTGA CGAGAAAAGC ATCAAGCCGG GCTTGCAGAC CTACAAGCGC TGATAAATGC 600 

GCCGGGGCCC TCGCTGCGCC CCCGGCCTTC CAATAATGAC AATAATGAGG AGTGCCCAAT 660 

GTTTCACGTG CCCCTGCTTA TTGGTGGTAA GCCTTGTTCA GCATCTGATG AGCGCACCTT 720 

C GAG CGT CGT AQC C CGCTGA CCGnAHAAnT nr.T7\Tr.r.C GC CTCGCTGCTC; CCAGTTTGGA 78Q 

AGATGCGGAC GCCGCAGTGG CCGCTGCACA GGCTGCGTTT CCTGAATGGG CGGCGCTTGC 84 0 

TCCGAGCGAA CGCCGTGCCC GACTGCTGCG AGCGGCGGAT CTTCTAGAGG ACCGTTCTTC 900 

^^^^ CGAGTTCACC GCCGCAGCGA GTGAAACTGG CGCAGCGGGA AACTGGTATG GGTTTAACGT 960 

^^B^^^TTACCTGGCG GCGGGCATGT TGCGGGGAAT TO 992 
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Sequenz 13 

GAATTCCAAT AATGACAATA ATGAGGAGTG CCCAATGTTT CACGTGCCCC TGCTTATTGG 60 

TGGTAAGCCT TGTTCAGCAT CTGATGAGCG CACCTTCGAG CGTCGTAGCC CGCTGACCGG 120 

AGAAGTGGTA TCGCGCGTCG CTGCTGCCAG TTTGGAAGAT GCGGACGCCG CAGTGGCCGC 180 

TGCACAGGCT GCGTTTCCTG AATGGGCGGC GCTTGCTCCG AGCGAACGCC GTGCCCGACT 24 0 

GCTGCGAGCG GCGGATCTTC TAGAGGACCG TTCTTCCGAG TTCACCGCCG CAGCGAGTGA 300 

AACTGGCGCA GCGGGAAACT GGTATGGGTT TAACGTTTAC CTGGCGGCGG GCATGTTGCG 360 

GGAAGCCGCG GCCATGACCA CACAGATTCA GGGCGATGTC ATTCCGTCCA ATGTGCCCGG 4 20 

TAGCTTTGCC ATGGCGGTTC GACAGCCATG TGGCGTGGTG CTCGGTATTG CGCCTTGGAA 480 

TGCTCCGGTA ATCCTTGGCG TACGGGCTGT TGCGATGCCG TTGGCATGCG GCAATACCGT 540 

GGTGTTGAAA AGCTCTGAGC TGAGTCCCTT TACCCATCGC CTGATTGGTC AGGTGTTGCA 600 

TGATGCTGGT CTGGGGGATG GCGTGGTGAA TGTCATCAGC AATGCCCCGC AAGACGCTCC 660 

TGCGGTGGTG GAGCGACTGA TTGCAAATCC TGCGGTACGT CGAGTGAACT TCACCGGTTC 720 

jGACCCACC ^TT qnAC ^GGATCA TTGGTGAGHT CTC^r^rcra.^ ny ?C.^aT\T\ac. CTGrTGTGCT 780_ 

GGAATTAGGT GGTAAGGCTC CGTTCTTGGT CTTGGACGAT GCCGACCTCG ATGCGGCGGT 84 0 

CGAAGCGGCG GCCTTTGGTG CCTACTTCTU^ TCAGGGTCAA ATCTGCATGT CCACTGAGCG 900 

TCTGATTGTG ACAGCAGTCG CAGACGCCTT TGTTGAAAAG CTGGCGAGGA AGGTCGCCAC 960 

ACTGCGTGCT GGCGATCCTA ATGATCCGCA ATCGGTCTTG GGTTCGTTGA TTGATGCCAA 1020 

TGCAGGTCAA CGCATCCAGG TTCTGGTCGA TGATGCGCTC GGGGACAGCA AGCGAACCGG 1080 

AATTGCCAGC TGGGGCGCCC TCTGGTAAGG TTGGGAAGCC CTGCAAAGTA AACTGGATGG 1140 

CTTTCTTGCC GCCAAGGATC TGATGGCGCA GGGGATCAAG ATCTGATCAA GAGACAGGAT 1200 

GAGGATCGTT TCGCATGATT GAACAAGATG GATTGCACGC AGGTTCTCCG GCCGCTTGGG 12 60 

TGGAGAGGCT ATTCGGCTAT GACTGGGCAC AACAGACAAT CGGCTGCTCT GATGCCGCCG 1320 

TGTTCCGGCT GTCAGCGCAG GGGCGCCCGG TTCTTTTTGT CAAGACCGAC CTGTCCGGTG 1380 

CCCTGAATGA ACTGCAGGAC GAGGCAGCGC GGCTATCGTG GCTGGCCACG ACGGGCGTTC 14 40 

CTTGCGCAGC TGTGCTCGAC GTTGTCACTG AAGCGGGAAG GGACTGGCTG CTATTGGGCG 1500 

AAGTGCCGGG GCAGGATCTC CTGTCATCTC ACCTTGCTCC TGCCGAGAAA GTATCCATCA 15 60 

TGGCTGATGC AATGCGGCGG CTGCATACGC TTGATCCGGC TACCTGCCCA TTCGACCACC 1620 

AAGCGAAACA TCGCATCGAG CGAGCACGTA CTCGGATGGA AGCCGGTCTT GTCGATCAGG 168 0 

ATGATCTGGA CGAAGAGCAT CAGGGGCTCG CGCCAGCCGA ACTGTTCGCC AGGCTCAAGG 17 4 0 

CGCGCATGCC CGACGGCGAG GATCTCGTCG TGACCCATGG CGATGCCTGC TTGCCGAATA 1800 

TCATGGTGGA AAATGGCCGC TTTTCTGGAT TCATCGACTG TGGCCGGCTG GGTGTGGCGG 18 60 

ACCGCTATCA GGACATAGCG TTGGCTACCC GTGATATTGC TGAAGAGCTT GGCGGCGAAT 1920 

GGGCTGACCG CTTCCTCGTG CTTTACGGTA TCGCCGCTCC CGATTCGCAG CGCATCGCCT 1980 

TCTATCGCCT TCTTGACGAG TTCTTCTGAG CGGGACTCTG GGGTTCGAAA TGACCGACCA 204 0 

AGCGACGCCC GGCCCAGCGC GTCGATTCGG GCATTTGCCA TATCAATGGA CCGACTGTGC 2100 

ATGACGAGGC TCAGATGCCA TTCGGTGGGG TGAAGTCCAG CGGCTACGGC AGCTTCGGCA 2160 
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GTCGAGCATC GATTGAGCAC TTTACCCAGC TGCGCTGGCT GACCATTCAG AATGGCCCGC 2220 

GGCACTATCC AATCTAAATC GATCTTCGGG CGCCGCGGGC ATCATGCCCG CGGCGCTCGC 2280 

CTCATTTCAA TCTCTAACTT GATAAAAACA GAGCTGTTCT CCGGTCTTGG TGGATCAAGG 2340 

CCAGTCGCGG AGAGTCTCGA AGAGGAGAGT ACAGTGAACG CCGAGTCCAC ATTGCAACCG 2400 

CAGGCATCAT CATGCTCTGC TCAGCCACGC TACCGCAGTG TGTCGATTGG TCATCCTCCG 24 60 

GTTGAGGTTA CGCAAGACGC TGGAGGTATT GTCCGGATGC GTTCTCTCGA GGCGCTTCTT 2520 

CCCTTCCCGG GTGGAATTC 2539 
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Sec[uenz 14 

GAATTCCAAT AATGACAATA ATGAGGAGTG CCCAATGTTT CACGTGCCCC TGCTTATTGG 60 

TGGTAAGCCT TGTTCAGCAT CTGATGAGCG CACCTTCGAG CGTCGTAGCC CGCTGACCGG 120 

AGAAGTGGTA TCGCGCGTCG CTGCTGCCAG TTTGGAAGAT GCGGACGCCG CAGTGGCCGC 180 

TGCACAGGCT GCGTTTCCTG AATGGGCGGC GCTTGCTCCG AGCGAACGCC GTGCCCGACT 2 40 

GCTGCGAGCG GCGGATCTTC TAGAGGACCG TTCTTCCGAG TTCACCGCCG CAGCGAGTGA 300 

AACTGGCGCA GCGGGAAACT GGTATGGGTT TAACGTTTAC CTGGCGGCGG GCATGTTGCG 3 60 

GGAAGCCGCG GCCATGACCA CACAGATTCA GGGCGATGTC ATTCCGTCCA ATGTGCCCGG 4 20 

TAGCTTTGCC ATGGCGGTTC GACAGCCATG TGGCGTGGTG CTCGGTATTG CGCCTTGGAA 4 80 

TGCTCCGGTA ATCCTTGGCG TACGGGCTGT TGCGATGCCG TTGGCATGCG GCAATACCGT 54 0 

GGTGTTGAAA AGCTCTGAGC TGAGTCCCTT TACCCATCGC CTGATTGGTC AGGTGTTGCA 600 

TGATGCTGGT CTGGGGGATG GCGTGGTGAA TGTCATCAGC AATGCCCCGC AAGACGCTCC 660 

TGCGGTGGTG GAGCGACTGA TTGCA7VATCC TGCGGTACGT CGAGTGAACT TCACCGGTTC 720 

nArrCAr.GTT GC^j f VCGGATCA TTGGTGAGr . T GTCTG CncaT nATCTGTVAGC CTGCTGTGCT 780 

GGAATTAGGT GGTAAGGCTC CGTTCTTGGT CTTGGACGAT GCCGACCTCG ATGCGGCGGT WW 

CGAAGCGGCG GCCTTTGGTG CCTACTTCAA TCAGGGTCAA ATCTGCATGT CCACTGAGCG 900 

TCTGATTGTG ACAGCAGTCG CAGACGCCTT TGTTGAAAAG CTGGCGAGGA AGGTCGCCAC 960 

ACTGCGTGCT GGCGATCCTA ATGATCCGCA ATCGGTCTTG GGTTCGTTGA TTGATGCCAA 1020 

TGCAGGTCAA CGCATCCAGG TGGGGAGAGG CGGTTTGCGT ATTGGGCGCA TGCATAAAAA 1080 

CTGTTGTAAT TCATTAAGCA TTCTGCCGAC ATGGAAGCCA TCACAAACGG CATGATGAAC 114 0 

CTGAATCGCC AGCGGCATCA GCACCTTGTC GCCTTGCGTA TAATATTTGC CCATGGACGC 1200 

ACACCGTGGA AACGGATGAA GGCACGAACC CAGTTGACAT AAGCCTGTTC GGTTCGTAAA 12 60 

CTGTAATGCA AGTAGCGTAT GCGCTCACGC AACTGGTCCA GAACCTTGAC CGAACGCAGC 1320 

GGTGGTAACG GCGCAGTGGC GGTTTTCATG GCTTGTTATG ACTGTTTTTT TGTACAGTCT 138 0 

ATGCCTCGGG CATCCAAGCA GCAAGCGCGT TACGCCGTGG GTCGATGTTT GATGTTATGG 14 4 0 

AGCAGCAACG ATGTTACGCA GCAGCAACGA TGTTACGCAG CAGGGCAGTC GCCCTAAAAC 1500 

AAAGTTAGGT GGCTCAAGTA TGGGCATCAT TCGCACATGT AGGCTCGGCC CTGACCAAGT 15 60 

CAAATCCATG CGGGCTGCTC TTGATCTTTT CGGTCGTGAG TTCGGAGACG TAGCCACCTA 1620 

CTCCCAACAT CAGCCGGACT CCGATTACCT CGGGAACTTG CTCCGTAGTA AGACATTCAT 1680 

CGCGCTTGCT GCCTTCGACC AAGAAGCGGT TGTTGGCGCT CTCGCGGCTT ACGTTCTGCC 17 4 0 

CAGGTTTGAG CAGCCGCGTA GTGAGATCTA TATCTATGAT CTCGCAGTCT CCGGCGAGCA 1800 

CCGGAGGCAG GGCATTGCCA CCGCGCTCAT CAATCTCCTC AAGCATGAGG CCAACGCGCT 18 60 

TGGTGCTTAT GTGATCTACG TGCAAGCAGA TTACGGTGAC GATCCCGCAG TGGCTCTCTA 1920 

TACAAAGTTG GGCATACGGG AAGAAGTGAT GCACTTTGAT ATCGACCCAA GTACCGCCAC 1980 

CTAACAATTC GTTCAAGCCG AGATCGGCTT CCCAATTGGC CCAGCGCGTC GATTCGGGCA 2040 

TTTGCCATAT CAATGGACCG ACTGTGCATG ACGAGGCTCA GATGCCATTC GGTGGGGTGA 2100 

AGTCCAGCGG CTACGGCAGC TTCGGCAGTC GAGCATCGAT TGAGCACTTT ACCCAGCTGC 2160 
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GCTGGCTGAC CATTCAGAAT GGCCCGCGGC ACTATCCAAT CTAAATCGAT CTTCGGGCGC 2220 

CGCGGGCATC ATGCCCGCGG CGCTCGCCTC ATTTCAATCT CTAACTTGAT AATW^CAGAG 2280 

CTGTTCTCCG GTCTTGGTGG ATCAAGGCCA GTCGCGGAGA GTCTCGAAGA GGAGAGTACA 2340 

GTGAACGCCG AGTCCACATT GCAACCGCAG GCATCATCAT GCTCTGCTCA GCCACGCTAC 24 00 

CGCAGTGTGT CGATTGGTCA TCCTCCGGTT GAGGTTACGC AAGACGCTGG AGGTATTGTC 24 60 

CGGATGCGTT CTCTCGAGGC GCTTCTTCCC TTCCCGGGTG GAATTC 2506 
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Sequenz 15 

GAATTCCAAT AATGACAATA ATGAGGAGTG CCCAATGTTT CACGTGCCCC TGCTTATTGG 60 

TGGTAAGCCT TGTTCAGCAT CTGATGAGCG CACCTTCGAG CGTCGTAGCC CGCTGACCGG 120 

AGAAGTGGTA TCGCGCGTCG CTGCTGCCAG TTTGGAAGAT GCGGACGCCG CAGTGGCCGC 180 

TGCACAGGCT GCGTTTCCTG AATGGGCGGC GCTTGCTCCG AGCGAACGCC GTGCCCGACT 24 0 

GCTGCGAGCG GCGGATCTTC TAGAGGACCG TTCTTCCGAG TTCACCGCCG CAGCGAGTGA 300 

AACTGGCGCA GCGGGAAACT GGTATGGGTT TAACGTTTAC CTGGCGGCGG GCATGTTGCG 360 

GGAAGCCGCG GCCATGACCA CACAGATTCA GGGCGATGTC ATTCCGTCCA ATGTGCCCGG 420 

TAGCTTTGCC ATGGCGGTTC GACAGCCATG TGGCGTGGTG CTCGGTATTG CGCCTTGGAA 4 80 

TGCTCCGGTA ATCCTTGGCG TACGGGCTGT TGCGATGCCG TTGGCATGCG GCAATACCGT 540 

GGTGTTGAAA AGCTCTGAGC TGAGTCCCTT TACCCATCGC CTGATTGGTC AGGTGTTGCA 600 

TGATGCTGGT CTGGGGGATG GCGTGGTGAA TGTCATCAGC AATGCCCCGC AAGACGCTCC 660 

TGCGGTGGTG GAGCGACTGA TTGCAAATCC TGCGGTACGT CGAGTGAACT TCACCGGTTC 720 

n^JUSggj^SCT^ErnrnSgAQ^CATCA TY G G T G C T CTfTTCCQCQT CrLTf?Tf5AftQC IQQ- 

GGAATTAGGT GGTAAGGCTC CGTTCTTGGT CTTGGACGAT GCCGACCTCG ATGCGGCGGT 840 

CGAAGCGGCG GCCTTTGGTG CCTACTTCAA TCAGGGTCAA ATCTGCATGT CCACTGAGCG 900 

TCTGATTGTG ACAGCAGTCG CAGACGCCTT TGTTGAAAAG CTGGCGAGGA AGGTCGCCAC 960 

ACTGCGTGCT GGCGATCCTA ATGATCCGCA ATCGGTCTTG GGTTCGTTGA TTGATGCCAA 1020 

ItGCAGGTCAA CGCATCCAGG TTCTGGTCGA TGATGCGCTC GCAAAAGGCG CGCAATGGAA 1080 

TTGGCCCAGC GCGTCGATTC GGGCATTTGC CATATCAATG GACCGACTGT GCATGACGAG 114 0 

GCTCAGATGC CATTCGGTGG GGTGAAGTCC AGCGGCTACG GCAGCTTCGG CAGTCGAGCA 1200 

TCGATTGAGC ACTTTACCCA GCTGCGCTGG CTGACCATTC AGAATGGCCC GCGGCACTAT 12 60 

CCAATCTAAA TCGATCTTCG GGCGCCGCGG GCATCATGCC CGCGGCGCTC GCCTCATTTC 1320 

AATCTCTAAC TTGATAAAAA CAGAGCTGTT CTCCGGTCTT GGTGGATCAA GGCCAGTCGC 1380 

GGAGAGTCTC GAAGAGGAGA GTACAGTGAA CGCCGAGTCC ACATTGCAAC CGCAGGCATC 14 4 0 

ATCATGCTCT GCTCAGCCAC GCTACCGCAG TGTGTCGATT GGTCATCCTC CGGTTGAGGT 1500 

TACGCAAGAC GCTGGAGGTA TTGTCCGGAT GCGTTCTCTC GAGGCGCTTC TTCCCTTCCC 1560 

GGGTGGAATT C 1571 
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Sequenz 16 



GAATTCCGCG 
GTGACGAGGC 
GTTGGTTGCG 
GCCTATCGAC 
ACAAATGGTC 
GCTCCCGCGG 
GCAGCGCATT 
AGGCGCTGAT 
GTATACACAC 
GGAGGCATTG 
GACAGCAAGC 
CAAAGTAAAC 



GTCGGCGAAA 
CACACTGTGA 
GCAGTGCGCA 
TTAGGGGTAA 
GATAGCGTAC 
CACATTGGCT 
TGCGGCACAG 
CACGTGCTGT 
CGGGGCGGGT 
TTTGATCCTG 
GAACCGGAAT 
TGGATGGCTT 



GTTGATGCGC 
GTTGGTCAGG 
CCCCCTGGAT 
AGGTCGCTCG 
TCGCAGGCTC 
TGTACAGCGG 
GCTTCGAACT 
GTGTCGCGGC 
TCCGCCTCGG 
CTCCAGGACT 
TGCCAGCTGG 
TCTTGCCGCC 



TGTATCGTGG 
GGGGGCTTAC 
TGATTGCGGG 
CGAAGTTCTG 
TATGGCTCAA 
TGTTCCCAAG 
GCTTCGGCAG 
AGAGTCCATG 
TGCGCCCGTT 
CGACATGATC 
GGCGCCCTCT 
AAGGATCTGA 



TGAAGATCAA 
TCGGCGTTTT 
GGTGCCCTGT 
ATGCGTGCGT 
GCAAGCTTTG 
TCGGTTCCGG 
GCCGGCGAGC 
TCGCGTAACC 
GAGTTCAAGG 
GCTACCGCAG 
GGTAAGGTTG 
TGGCGCAGGG 



TCCATGCTGC 
CCGACACTGC 
CGCTGGTGTC 
CGCTTGAACC 
ATGCTTACCT 
CCTTGGGGGT 
AGATTTCCCA 
CCATCGCGTC 
ATTTTTTGTG 
AAAACCTGGG 
GGAAGCCCTG 
GATCAAGATC 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
mn 





TTCTCCGGCC 
CTGCTCTGAT 
GACCGACCTG 
GGCCACGACG 
CTGGCTGCTA 
CGAGAAAGTA 
CTGCCCATTC 
CGGTCTTGTC 
GTTCGCCAGG 
TGCCTGCTTG 
CCGGCTGGGT 
AGAGCTTGGC 
TTCGCAGCGC 
TTCGAAATGA 
AGAGATCGTG 
TGAACTGCCT 
TGAAGCCCTT 
CTGTGCCGTA 
GCCGGTCTTG 
GCTCGGCCCT 
TATCGACCTC 
ATTGGGTATT 
GCTTGCCGCG 



GCTTGGGTGG 
GCCGCCGTGT 
TCCGGTGCCC 
GGCGTTCCTT 
TTGGGCGAAG 
TCCATCATGG 
GACCACCAAG 
GATCAGGATG 
CTCAAGGCGC 
CCGAATATCA 
GTGGCGGACC 
GGCGAATGGG 
ATCGCCTTCT 
CCGACCAAGC 
GCTGTTACGG 
CGGAAGGCAA 
TCCCGATTGA 
GTGGACGGCG 
GCTAGGATAC 
GCGCCCGCGA 
TTTGAGATAA 
GAGCACTCAA 
ACCGGATTGC 



AGAGGCTATT 
TCCGGCTGTC 
TGAATGAACT 
GCGCAGCTGT 
TGCCGGGGCA 
CTGATGCAAT 
CGAAACATCG 
ATCTGGACGA 
GCATGCCCGA 
TGGTGGAAAA 
GCTATCAGGA 
CTGACCGCTT 
ATCGCCTTCT 
GACGCCCATT 
ATGAACAGTT 
AATTGTTGAT 
AGCCTGTTCA 
CCGCGGCGGC 
TGGCTACCTC 
TTCGCCTGCT 
ACGAGGCGCA 
AACTTAATAT 
GTCTCTGCAT 



CGGCTATGAC 
AGCGCAGGGG 
GCAGGACGAG 
GCTCGACGTT 
GGATCTCCTG 
GCGGCGGCTG 
CATCGAGCGA 
AGAGCATCAG 
CGGCGAGGAT 
TGGCCGCTTT 
CATAGCGTTG 
CCTCGTGCTT 
TGACGAGTTC 
GAGGGCGCAA 
CGATTTAGAG 
CGTGACAGTC 
TTCTGGCGGG 
TTTGGTGGCT 
CGTAGTCGGG 
GCTTGCGCGT 
GGCCGCCCAA 
TTGGGGCGGG 
GACCCTCGCT 



TGGGCACAAC 
CGCCCGGTTC 
GCAGCGCGGC 
GTCACTGAAG 
TCATCTCACC 
CATACGCTTG 
GCACGTACTC 
GGGCTCGCGC 
CTCGTCGTGA 
TCTGGATTCA 
GCTACCCGTG 
TACGGTATCG 
TTCTGAGCGG 
GAGGAGAAAT 
GGCTACAACA 
ATCCGCGGCC 
GTGCAGACTG 
CGAGAGTCGT 
ATCGAGCCCG 
AGTGATCTTA 
GTTCTAGCGG 
GCCATTGCAC 
CACCAATTGC 



AGACAATCGG 
TTTTTGTCAA 
TATCGTGGCT 
CGGGAAGGGA 
TTGCTCCTGC 
ATCCGGCTAC 
GGATGGAAGC 
CAGCCGAACT 
CCCATGGCGA 
TCGACTGTGG 
ATATTGCTGA 
CCGCTCCCGA 
GACTCTGGGG 
GGATTGACCA 
GTCGAGCAAT 
TAGCAGTCTT 
CGGGCAACAG 
CTGCGACACA 
AGCATATGGG 
GTTTGAGGGA 
TACAGCATGA 
TTGGACACCC 
AAGCTAATAA 



840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
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CTTTCGATAT GGAATTGCCT CGGCATGCAT TGGTGGGGGA CAGGGGATGG CGGTTCTTTT 2220 

AGAGAATCCC CACTTCGGTT CGTCCTCTGC ACGAAGTTCG ATGATTAACA GAGTTGACCA 2280 

CTATCCACTG AGCTAACGGG CATCTCCTTT GTTGCTTTGA GGTGGCGCAC GAAGGAGGGC 234 0 

TCGAAAATCT CTGCTAAAAA CAAGAAGAAG GAACAGGGAA CATGATTAGT TTCGCTCGTA 24 00 

TGGCAGAAAG TTTAGGAGTC CAGGCTAAAC TTGCCCTTGC CTTCGCACTC GTATTATGTG 24 60 

TCGGGCTGAT TGTTACCGGC ACGGGTTTCT ACAGTGTACA TACCTTGTCA GGGTTGGTGG 2520 

GAATTC 2526 
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Sequenz 17 



GAATTCCGCG 
GTGACGAGGC 
GTTGGTTGCG 
GCCTATCGAC 
ACAAATGGTC 
GCTCCCGCGG 
GCAGCGCATT 
AGGCGCTGAT 
GTATACACAC 
GGAGGCATTG 
GGAGAGGCGG 
TGCCGACATG 
CCTTGTCGCC 



gtcggcgaaa 
cacactgtga 
gcagtgcgca 
ttaggggtaa 
gatagcgtac 
cacattggct 
tgcggcacag 
cacgtgctgt 
cggggcgggt: 

TTTGATCCTG 
TTTGCGTATT 
GAAGCCATCA 
TTGCGTATAgu 



GTTGATGCGC 
GTTGGTCAGG 
CCCCCTGGAT 
AGGTCGCTCG 
TCGCAGGCTC 
TGTACAGCGG 
GCTTCGAACT 
GTGTCGCGGC 
TCCGCCTCGG 
CTCCAGGACT 
GGGCGCATGC 
CAAACGGCAT 
TATTTGCCCA 



TGTATCGTGG 
GGGGGCTTAC 
TGATTGCGGG 
CGAAGTTCTG 
TATGGCTCAA 
TGTTCCCAAG 
GCTTCGGCAG 
AGAGTCCATG 
TGCGCCCGTT 
CGACATGATC 
ATAAAAACTG 
GATGAACCTG 



TGAAGATCAA 
TCGGCGTTTT 
GGTGCCCTGT 
ATGCGTGCGT 
GCAAGCTTTG 
TCGGTTCCGG 
GCCGGCGAGC 
TCGCGTAACC 
GAGTTCAAGG 
GCTACCGCAG 
TTGTAATTCA 
AATCGCCAGC 
CCGTGGAAAC 



TCCATGCTGC 
CCGACACTGC 
CGCTGGTGTC 
CGCTTGAACC 
ATGCTTACCT 
CCTTGGGGGT 
AGATTTCCCA 
CCATCGCGTC 
ATTTTTTGTG 
AAAACCTGGG 
TTAAGCATTC 
GGCATCAGCA 
GGATGAAGGC 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 





ACGAACCCAG 
CTCACGCAAC 
TTTCATGGCT 
AGCGCGTTAC 
iGCAACGATGT 
GCATCATTCG 
ATCTTTTCGG 
ATTACCTCGG 
AAGCGGTTGT 
AGATCTATAT 
CGCTCATCAA 
AAGCAGATTA 
AAGTGATGCA 
TCGGCTTCCC 
CGGATGAACA 
CAAAATTGTT 
TGAAGCCTGT 
GCGCCGCGGC 
TACTGGCTAC 
CGATTCGCCT 
TAAACGAGGC 
CAAAACTTAA 
TGCGTCTCTG 



TTGACATAAG 
TGGTCCAGAA 
TGTTATGACT 
GCCGTGGGTC 
TACGCAGCAG 
CACATGTAGG 
TCGTGAGTTC 
GAACTTGCTC 
TGGCGCTCTC 
CTATGATCTC 
TCTCCTCAAG 
CGGTGACGAT 
CTTTGATATC 
ATTGAGGGCG 
GTTCGATTTA 
GATCGTGACA 
TCATTCTGGC 
GGCTTTGGTG 
CTCCGTAGTC 
GCTGCTTGCG 
GCAGGCCGCC 
TATTTGGGGC 
CATGACCCTC 



CCTGTTCGGT 
CCTTGACCGA 
GTTTTTTTGT 
GATGTTTGAT 
GGCAGTCGCC 
CTCGGCCCTG 
GGAGACGTAG 
CGTAGTAAGA 
GCGGCTTACG 
GCAGTCTCCG 
CATGAGGCCA 
CCCGCAGTGG 
GACCCAAGTA 
CAAGAGGAGA 
GAGGGCTACA 
GTCATCCGCG 
GGGGTGCAGA 
GCTCGAGAGT 
GGGATCGAGC 
CGTAGTGATC 
CAAGTTCTAG 
GGGGCCATTG 
GCTCACCAAT 



TCGTAAACTG 
ACGCAGCGGT 
ACAGTCTATG 
GTTATGGAGC 
CTAAAACAAA 
ACCAAGTCAA 
CCACCTACTC 
CATTCATCGC 
TTCTGCCCAG 
GCGAGCACCG 
ACGCGCTTGG 
CTCTCTATAC 
CCGCCACCTA 
AATGGATTGA 
ACAGTCGAGC 
GCCTAGCAGT 
CTGCGGGCAA 
CGTCTGCGAC 
CCGAGCATAT 
TTAGTTTGAG 
CGGTACAGCA 
CACTTGGACA 
TGCAAGCTAA 



TAATGCAAGT 
GGTAACGGCG 
CCTCGGGCAT 
AGCAACGATG 
GTTAGGTGGC 
ATCCATGCGG 
CCAACATCAG 
GCTTGCTGCC 
GTTTGAGCAG 
GAGGCAGGGC 
TGCTTATGTG 
AAAGTTGGGC 
ACAATTCGTT 
CCAAGAGATC 
AATTGAACTG 
CTTTGAAGCC 
CAGCTGTGCC 
ACAGCCGGTC 
GGGGCUCGGC 
GGATATCGAC 
TGAATTGGGT 
CCCGCTTGCC 
TAACTTTCGA 



AGCGTATGCG 
CAGTGGCGGT 
CCAAGCAGCA 
TTACGCAGCA 
TCAAGTATGG 
GCTGCTCTTG 
CCGGACrCCG 
TTCGACCAAG 
CCGCGTAGTG 
ATTGCCACCG 
ATCTACGTGC 
ATACGGGAAG 
CAAGCCGAGA 
GTGGCTGTTA 
CCTCGGAAGG 
CTTTCCCGAT 
GTAGTGGACG 
TTGGCTAGGA 
CCTGCGCCCG 
CTCTTTGAGA 
ATTGAGCACT 
GCGACCGGAT 
TATGGAATTG 



840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 




CCTCGGCATG CATTGGTGGG GGACAGGGGA TGGCGGTTCT TTTAGAGAAT CCCCACTTCG 2220 

GTTCGTCCTC TGCACGAAGT TCGATGATTA ACAGAGTTGA CCACTATCCA CTGAGCTAAC 2280 

GGGCATCTCC TTTGTTGCTT TGAGGTGGCG CACGAAGGAG GGCTCGAAAA TCTCTGCTAA 234 0 

AAACAAGAAG AAGGAACAGG GAACATGATT AGTTTCGCTC GTATGGCAGA AAGTTTAGGA 2 400 

GTCCAGGCTA AACTTGCCCT TGCCTTCGCA CTCGTATTAT GTGTCGGGCT GATTGTTACC 24 60 

GGCACGGGTT TCTACAGTGT ACATACCTTG TCAGGGTTGG TGGGAATTC 2509 
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Sequenz 18 



GAATTCCGCG 
GTGACGAGGC 
GTTGGTTGCG 
GCCTATCGAC 
ACAAATGGTC 
GCTCCCGCGG 
GCAGCGCATT 
AGGCGCTGAT 
GTATACACAC 
GGAGGCATTG 
GCGCATTGAG 
AACAGTTCGA 



GTCGGCGAAA 
CACACTGTGA 
GCAGTGCGCA 
TTAGGGGTAA 
GATAGCGTAC 
CACATTGGCT 
TGCGGCACAG 
CACGTGCTGT 
CGGGGCGGGT 
TTTGATCCTG 
GGCGCAAGAG 
TTTAGAGGGC 



GTTGATGCGC 
GTTGGTCAGG 
CCCCCTGGAT 
AGGTCGCTCG 
TCGCAGGCTC 
TGTACAGCGG 
GCTTCGAACT 
GTGTCGCGGC 
TCCGCCTCGG 
CTCCAGGACT 
GAGAAATGGA 
TACAACAGTC 



TGTATCGTGG 
GGGGGCTTAC 
TGATTGCGGG 
CGAAGTTCTG 
TATGGCTCAA 
TGTTCCCAAG 
GCTTCGGCAG 
AGAGTCCATG 
TGCGCCCGTT 
CGACATGATC 
TTGACCAAGA 
GAGCAATTGA 



TGAAGATCAA 
TCGGCGTTTT 
GGTGCCCTGT 
ATGCGTGCGT 
GCAAGCTTTG 
TCGGTTCCGG 
GCCGGCGAGC 
TCGCGTAACC 
GAGTTCAAGG 
GCTACCGCAG 
GATCGTGGCT 
ACTGCCTCGG 



TCCATGCTGC 
CCGACACTGC 
CGCTGGTGTC 
CGCTTGAACC 
ATGCTTACCT 
CCTTGGGGGT 
AGATTTCCCA 
CCATCGCGTC 
ATTTTTTGTG 
AAAACCTGGC 
GTTACGGATG 
AAGGCAAAAT 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 




CTGTTCATTC 
CGGCGGCTTT 
CTACCTCCGT 
GCCTGCTGCT 
AGGCGCAGGC 
TTAATATTTG 
TCTGCATGAC 
CATGCATTGG 
CCTCTGCACG 
CTCCTTTGTT 
GAAGAAGGAA 
GCTAAACTTG 
GGTTTCTACA 



TGGCGGGGTG 
GGTGGCTCGA 
AGTCGGGATC 
TGCGCGTAGT 
CGCCCAAGTT 
GGGCGGGGCC 
CCTCGCTCAC 
TGGGGGACAG 
AAGTTCGATG 
GCTTTGAGGT 
CAGGGAACAT 
CCCTTGCCTT 
GTGTACATAC 



CAGACTGCGG 
GAGTCGTCTG 
GAGCCCGAGC 
GATCTTAGTT 
CTAGCGGTAC 
ATTGCACTTG 
CAATTGCAAG 
GGGhTGGCGG 
ATTAACAGAG 
GGCGCACGAA 
GATTAGTTTC 
CGCACTCGTA 
CTTGTCAGGG 



GCAACAGCTG 
CGACACAGCC 
ATATGGGGCT 
TGAGGGATAT 
AGCATGAATT 
GACACCCGCT 
CTAATAACTT 
TTCTTTTAGA 
TTGACCACTA 
GGAGGGCTCG 
GCTCGTATGG 
TTATGTGTCG 
TTGGTGGGAA 



TGCCGTAGTG 
GGTCTTGGCT 
CGGCCCTGCG 
CGACCTCTTT 
GGGTATTGAG 
TGCCGCGACC 
TCGATATGGA 
GAATCCCCAC 
TCCACTGAGC 
AAAATCTCTG 
CAGAAAGTTT 
GGCTGATTGT 
TTC 



GACGGCGCCG 
AGGATACTGG 
CCCGCGATTC 
GAGATAAACG 
CACTCAAAAC 
GGATTGCGTC 
ATTGCCTCGG 
TTCGGTTCGT 
TAACGGGCAT 
CTAAAAACAA 
AGGAGTCCAG 
TACCGGCACG 



840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1543 
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Patentanspriiche 

I . Transformierter und/oder mutagenisierter ein- oder mehrzelliger Organismus, 
der dadurch gekennzeichnet ist, daB Enzyme des Eugenol- und/oder Ferula- 
saure-Katabolismus derart inaktiviert sind, daB eine Akkumulation der 
Intermediate Coniferylalkohol, Coniferylaldehyd, Ferulasaure, Vanillin 
und/oder Vanillinsaure erfolgt. 



2. Organismus nach Anspruch 1, dadurch gekennzeichnet, dali der Eugenol- 
und/oder Ferulasaure-Katabolismus durch Q-Element-Insertion oder Einfuh- 
ren von Deletionen in entsprechende Gene verandert ist. 

3. Organismus nach einem der Anspriiche 1 oder 2, dadurch gekennzeichnet, 
daB ein oder mehrere Gene, die fur die Enzyme Coniferylalkohol-Dehydro- 
genasen, Coniferylaldehyd-Dehydrogenasen, Ferulasaure-CoA Synthetasen, 
Enoyl-CoA Hydratasen-Aldolasen, beta-Ketothiolasen, Vanillin-Dehydro- 
genasen oder Vanillinsaure-Demethylasen Enzyme kodieren, verandert 
und/oder inaktiviert sind. 

4. Organismus nach einem der Anspriiche 1 bis 3, dadurch gekermzeichnet, daB 
er einzellig, vorzugsweise ein Mikroorganismus oder eine pflanzliche oder 
eine tierische Zelle ist. 

5. Organismus nach einem der Anspriiche 1 bis 4, dadurch gekennzeichnet, daB 
er ein Bakterium, vorzugsweise eine Pseudomonas-Avt ist. 

6. Gen-Strukturen, bei denen die fur die Enzyme Coniferylalkohol-Dehydroge- 
nasen, Coniferylaldehyd-Dehydrogenasen, Ferulasaure-CoA Synthetasen, 

_ EnpylrCp_A_Hydralasen-Ajdo Vanilhn-Dehydroge- 
nasen oderVanilHnsaure-Demethylasen oder zweier oder mehrerer dieser En- 
zyme kodierenden Nukleotidsequenzen verandert und/oder inaktiviert sind. 
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7. Gen-Strukturen mit den in Figur la bis Ir angegebenen Strukturen. 

8. Gen-Strukturen mit den in Figur 2a bis 2r angegebenen Sequenzen. 

9. Vektoren enthaltend wenigstens eine Gen-Struktur nach einem der Anspriiche 
6 bis 8. 




15 



10. Transformierter Organismus nach einem der Anspriiche 1 bis 5, dadurch 
gekermzeichnet, daB er wenigstens einen Vektor gemaB Anspruch 9 enthalt. 

11. Organismus nach einem der Anspriiche 1 bis 5, dadurch gekennzeichnet, daB 
er wenigstens eine Gen-Struktur nach einem der Anspriiche 6 bis 8 an Stelle 
des jeweiligen intakten Gens im Genom integriert enthalt. 

12. Verfahren zur biotechnischen Herstellung von organischen Verbindungen, 
insbesondere von Alkoholen, Aldehyden und organischen Sauren, dadurch 
gekermzeichnet, daB ein Organismus nach einem der Anspriiche 1 bis 5 oder 
1 0 bis 11 eingesetzt wird. 

13. Verfahren zur Herstellimg der Organismen nach einem der Anspriiche 1 bis 5, 
dadurch gekennzeichnet, daB die Veranderung des Eugenol- und/oder Femla- 
saure-KataboIismus mittels an sich bekannter mikrobiologischer Zuchtungs- 
methoden erzielt wird. 

14. Verfahren zur Herstellung eines Organismus nach einem der Anspriiche 1 bis 
5 oder 10 bis 11, dadurch gekennzeichnet, daB die Veranderung des Eugenol- 
und/oder Ferulasaure-Katabolismus und/oder die Inaktivierung der entspre- 
chenden Gen e mittels gentechnischer Me thoden erz ielt w ird. 




25 



30 
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15. Verwendung der Organismen nach einem der Anspriiche 1 bis 5 oder 10 bis 
11 zur Herstellung von Coniferylalkohol, Coniferylaldehyd, Ferulasaure, 
Vanillin und/oder Vanillinsaure. 

5 16. Verwendung von Gen-Stmkturen nach einem der Anspriiche 6 bis 8 oder 
eines Vektors nach Anspruch 9 zur Herstellung transformierter und/oder 
mutagenisierter Organismen. 




- 112- 

Konstruktion von Produktionsstamnien fur die HerstelLung von substttuierten 
Phenolen durch gezielte Inaktivierungen von Genen des Eugenol- und Ferula- 
saure-KataboIismus 



Zusammenfassung 




Die vorliegende Erfindung betrifft einen transformierten und/oder mutagenisierten 
ein- Oder mehrzelligen Organismus, der dadurch gekennzeichnet ist, daB Enzyme des 
Eugenol- und/oder Ferulasaure-Katabolismus derart inaktiviert sind, daB eine Akku- 
mulation der Intermediate Coniferylalkohol, Coniferylaldehyd, Ferulasaure, Vanillin 
und/oder Vanillinsaure erfoigt. 
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calAQKm 
Fig. 1a 



Psfl 



SM*/Bal31 Smal* 



Smai' BMVBal 31 



P5/I 




caMQGm 



Bf/IVBal 31 S/77al 

icalA*"^ 




Sma\* BMVBal 31 



Psfl 



Fig. 1b 




ca/Ad 
Fig. 1c 



Psfl 



BWVBal 31 



Psfl 




Deletion von 539 bp 




ca/eQGm 



EcoRI 



eg/IIVBal 31 Smal* 
V 



Smal* eg/ilVBal 31 



EcoRI 



Fig. 1e 



"calBA 



Fig. If 



EcoRI 



BglWVBal 31 



EcoRI 




Deletion von 586 bp 
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2A3 



/csQKm 
Fig. 1g 



BssHW Sma\' 



Smal* SssHII* 



Psa 




fcsQGm 



Fig. 1h 




Fig. 1i 



Psfl 



essHII*Smal* 



Smal* BssHW 




Ps/I 



BssHII 



Deletion von 1290 bp 




1j 



echQGm 



Fig. 1k 



EcoRI 



ec/7QKm ^ 



EcoRI 



A/rd* Smal* 





Smal* /Vrul* 
V 



EcoRI 



EcoRI 



ecfiA 



Fig. 11 



EcoRI 



Nrul 



EcoHl 




Deletion von 483 bp 
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vdhaKm 
Fig. 1m 



EcoRI 



SssHirSmal* 



Smal* BssHW 




EcoB\ 



vdhQGm 



EcoB\ 



mm. 



BssHWSma' 
V 



Smal* essHII* 
V 



EcoRI 



Fig. 1n 




vdhA 
Fig. 1o 



EcoRI 



BssHW 



EcoRI 



Deletion von 210 bp 




aaZQGm 
Fig. 1q 



EcoRI 



EcoRI 



BssHW* Sma\* 




Smal* BssHW 



EcoRI 



es5HII*Sn?ar 



SmarfissHir 



EcoRI 



aatA 



Fig. 1r 



EcoRI 



EssHII 



EcoRI 



Deletion von 59 bp 



